DeepSeek API的QPS限制因用户等级和环境而异:免费版0.83次/秒,专业版3.3次/秒,定制版16次/秒,开发/测试/生产环境分别10/50/100次/秒,突发配额最高200次/秒。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您尝试调用DeepSeek API时遭遇响应延迟、请求被拒绝或返回429错误,则很可能是触发了平台设定的每秒查询数(QPS)限制。以下是官方文档中明确列出的各用户等级对应的QPS限制详情:
一、免费版用户的QPS限制
免费版账户在未申请权限升级的前提下,受到最严格的实时并发控制。该限制旨在保障基础服务稳定性,适用于轻量级开发与测试场景。
1、默认QPS上限为0.83次/秒,等效于单次请求间隔不得低于20毫秒。
2、对应RPM(每分钟请求数)为50次/分钟,超出后立即触发限流并返回HTTP 429状态码。
3、若连续检测到短时高频请求,系统可能进一步动态收紧间隔至30毫秒以上以维持节点健康。
二、专业版用户的QPS限制
专业版面向中小规模生产环境设计,提供更高的并发吞吐能力,同时保留弹性降频机制以应对突发负载波动。
1、标称QPS软限为3.3次/秒,对应RPM上限为200次/分钟。
2、在持续高负载下,系统将自动将实际QPS降至2.5次/秒,避免服务过载。
3、该等级支持通过控制台临时申请配额提升,但QPS不参与小时级滚动提升,仅Token配额可扩展。
三、定制版用户的QPS限制
定制版面向企业级高并发需求部署,需配合IP白名单与租户隔离策略启用,否则仍按专业版限流执行。
1、QPS峰值可达16次/秒,对应RPM为1000次/分钟。
2、启用前提为完成租户绑定与指定IP段白名单配置,否则系统默认执行专业版限流策略。
3、超限行为不立即阻断请求,而是触发异步告警,并记录至租户监控仪表盘。
四、开发/测试/生产环境的QPS差异
API Key生成时强制选择运行环境,不同环境拥有独立QPS配额,且不可跨环境共享或转移。
1、开发环境默认QPS为10次/秒,但仅限控制台调试调用,不支持批量脚本调用。
2、测试环境QPS为50次/秒,允许自动化测试流程接入,需绑定测试域名白名单。
3、生产环境初始QPS为100次/秒,须完成实名认证与业务场景备案后方可启用。
五、突发配额下的QPS弹性机制
部分付费套餐支持突发配额模式,允许在限定时间窗内突破基础QPS限制,适用于大促、审计、批量生成等短期高负载场景。
1、突发QPS上限为200次/秒,可持续时长最长为5分钟。
2、突发期间所有请求按基础单价的1.5倍计费,费用明细实时同步至账单中心。
3、突发配额需提前至少30分钟通过控制台预申请,系统将在生效前10秒推送X-RateLimit-Reset头信息。











