讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 软件教程 > 手机软件 > 正文

DeepSeek开源V3/R1架构设计思路，原来545%的利润率，它也只是被逼无奈？

蓮花仙者

发布： 2025-04-23 16:34:16

原创

436人浏览过

《深探deepseek原理应用与实践》

15.DeepSeek-V3/R1架构设计思路

在开源周的最后一天，DeepSeek分享了DeepSeek-V3/R1的架构设计思路，让大家能够更系统、更全面地了解其推理系统的设计过程，以及更深入地理解之前开源的6个项目。

DeepSeek开源V3/R1架构设计思路，原来545%的利润率，它也只是被逼无奈？ DeepSeek-V3/R1推理系统的核心目标是什么？

通过软件架构的优化，达到：

更高的吞吐量；
更低的延时；

为什么DeepSeek选择了这条路？

曾经AI技术发展的瓶颈在于GPU。

当GPU成为瓶颈时，有两条路可走：

其一，水平扩展scale out：囤卡，堆GPU；其二，垂直扩展scale up：GPU升级换代；

但这两条路都被牢牢控制在国外手中。

囤卡受限，不允许你囤积。先进的卡不卖给你，因为你落后五年。

为了突破瓶颈，DeepSeek被迫走上了第三条路：通过软件优化架构。

为了实现目标，DeepSeek的核心方案是什么？

大规模的跨节点专家并行EP，Expert Parallelism。

通过增加专家并行EP的数量（batch size），提升GPU矩阵乘法的效率，从而提高吞吐量；同时，多个专家分散在不同的GPU上，每个GPU只需计算更少的专家，访问更少的数据，从而降低延迟。

大规模的跨节点专家并行EP会给软件架构带来哪些新的挑战？

EP跨节点传输，需要解决传输与计算并行的问题；
EP多节点联动，需要解决数据分发汇总、负载均衡等问题；

大规模的跨节点专家并行EP的部署与策略是怎样的？

由于V3/R1的专家数量众多，并且每层256个专家中仅激活其中8个，DeepSeek采用多机多卡间的专家并行策略来达到以下目的：

预填充阶段：路由专家EP-32、MLA和共享专家DP-32，一个部署单元是4节点，32个冗余路由专家，每张卡9个路由专家和1个共享专家；解码阶段：路由专家EP-144、MLA和共享专家DP-144，一个部署单元是18节点，32个冗余路由专家，每张卡2个路由专家和1个共享专家；这两个阶段的负载均衡策略各不相同。

如何解决计算与传输并行的问题？

多机多卡的专家并行会引入较大的通信开销，因此DeepSeek使用双向通道，提高整体吞吐量。

DeepSeek开源V3/R1架构设计思路，原来545%的利润率，它也只是被逼无奈？预填充阶段：计算和通信交替进行，一个通道计算时，另一个通道通信。

Dream Machine

Dream Machine

Dream Machine 是由 Luma AI 开发的一款 AI 视频生成工具，可以快速将文本和图像转换为高质量的视频内容。

Dream Machine

165

Dream Machine

DeepSeek开源V3/R1架构设计思路，原来545%的利润率，它也只是被逼无奈？解码阶段类似：计算与通信交替进行，通过流水线实现计算和通信的重叠。

如何最大程度地实现负载均衡？

由于采用了大规模的数据并行与专家并行，如果某个GPU的计算或通信负载过重，单个长尾将成为整个系统的瓶颈。与此同时，其他GPU因为等待而空转，造成整体资源利用率下降。因此，必须尽可能地为每个GPU平均分配计算负载和通信负载。

预填充阶段（prefilling stage）：

专家组分配到节点，保证节点负载均衡；
节点内复制专家；
专家分配到GPUs，保证GPUs负载均衡；

解码阶段（decoding stage）：

全局复制专家，不管专家在哪个组；
专家分配到GPUs，保证GPUs负载均衡；

总而言之，保证负载均衡，充分发挥GPUs的潜力，提升训练效率，缩短训练时间。

其整体架构如下：

DeepSeek开源V3/R1架构设计思路，原来545%的利润率，它也只是被逼无奈？ V3/R1的所有GPU均使用H800 GPU：

矩阵计算，分发：采用FP8格式；
核心注意力计算，合并：采用BF16格式；

同时兼顾效率与质量。

另外，由于白天的服务负荷高，晚上的服务负荷低，因此DeepSeek实现了一套机制：

在白天负荷高的时候，所有节点部署推理服务；
晚上负荷低的时候，减少推理节点，以用来做研究和训练；

综上所述，如果所有tokens全部按照R1的定价计算，理论上DeepSeek一天的总收入为$562,027，成本利润率545%。

到这里，DeepSeek开源周的所有7个项目就介绍完了，最后再来个汇总：

《FlashMLA：GPU告诉解码器》
《DeepEP：MOE与EP通讯库》
《DeepGEMM：FP8通用矩阵乘法库》
《DualPipe：双向管道并行算法》
《EPLB：EP动态负载均衡算法》
《3FS：高性能分布式文件系统》
《V3/R1架构设计思路（本文）》

补充阅读材料：

https://www.php.cn/link/2ac5f9cb8a8e89382c2fc21937c21ae6

官方git，可参考。

==全文完==

以上就是DeepSeek开源V3/R1架构设计思路，原来545%的利润率，它也只是被逼无奈？的详细内容，更多请关注php中文网其它相关文章！

相关标签：

git ai 为什么 deepseek batch 架构分布式堆 github git 算法 https 负载均衡

大家都在看：

pycharm如何查找文件历史记录微信小程序怎么做微信小程序开发入门教程如何在本地部署DeepSeek- DeepSeek本地部署指南及视频演示 hbuilder怎么用git 微信web开发者工具用什么语言写

AI工具

AI工具

AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型，支持联网搜索。

来源：php中文网

上一篇：猫箱app如何自设猫箱app创建角色方法下一篇：轻颜相机设置三秒拍照方法教程

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

x浏览器海外版如何启用网页翻译服务_x浏览器海外版翻译功能开启及使用技巧【锦囊】

2025-12-18 13:15:07
铁路12306如何查看订单记录_铁路12306查看订单记录详细查询教程

2025-12-18 13:20:56
poki小游戏入口分类页 poki在线游戏免安装体验

2025-12-18 13:26:02
uc浏览器图标怎么删除_删除uc浏览器图标的方法

2025-12-18 13:31:02
php表格怎么输入二维数组_php表格输入二维数组方法与填充技巧

2025-12-18 13:35:02
悟空浏览器官方正式版入口悟空浏览器网页版快速通道

2025-12-18 13:37:02
用什么app拍车辆违章能赚钱推荐5个拍车辆违章能赚钱的APP

2025-12-18 13:51:22
HTML如何改造老旧网页_重构与优化策略解析【教程】

2025-12-18 13:53:02
极兔快递单号查询官方网站极兔快递单号查询唯一入口

2025-12-18 14:03:33
啥app买机票便宜机票最便宜三个平台2026推荐

2025-12-18 14:04:06

最新问题

《永旺》添加收货地址方法进入永旺app后，首先点击底部导航栏中的“我的”功能选项。在个人中心页面中，找到并点击“地址管理”选项。在地址管理界面，选择“新增到家地址”按钮，开始添加新地址。填写详细的收货人姓名、手机号、所在地区及具体门牌号等信息后，点击“保存地址”即可完成操作。

2025-12-19 08:10:08

807

微信网页版可用访问入口合集微信网页版稳定登录页面指南微信网页版可通过https://web.wechat.com访问，扫码登录、多设备协同、界面优化、安全隐私及兼容性均完善。

2025-12-19 08:09:28

677

《星露谷物语》文森特爱心事件介绍《星露谷物语》文森特爱心事件介绍：爱心事件：8心事件：与文森特和贾斯都到8心后，在春季晴朗的白天进入煤矿森林。

2025-12-19 08:09:18

880

《长江e号》开户方法介绍如何开通长江e号？1、首先下载长江e号App，打开后进入应用的首页；2、在首页中找到并点击“开户”按钮；3、点击“下一步”，进入下一个操作界面；4、输入收到的验证码，然后继续点击“下一步”；5、按照页面提示填写个人资料。在开户过程中，需选择要开立的账户类型，包括“炒股票”和“买基金”两个选项。建议将两项都勾选，因为许多类似余额宝的理财服务功能需要通过“买基金”账户才能使用！

2025-12-19 08:09:08

145

勇者联盟刺客职业保姆级攻略勇者联盟刺客职业全面进阶指南职业定位与核心特点刺客——“暗影中的舞者，掌控生死的艺术家”核心优势一览全职业中顶尖的单体爆发输出能力具备残血斩杀机制，并能为团队提供破甲增益效果拥有高比例免伤与闪避区域，提升生存上限战术局限性必须贴近目标作战，攻击距离受限操作容错率偏低，易被近战范围技能命中导致暴毙01天赋流派选择解析极致输出流：天赋点全部倾向伤害提升，专注于最大化秒伤表现，适合追求极限DPS的玩家。处决特化流：围绕“淘汰弱者”技能构建体系，大幅提升深渊副本推进效率，是冲击排行榜速度的关键选择之一。

2025-12-19 08:07:19

973

河马剧场如何提现河马剧场作为一款备受欢迎的影视娱乐平台，拥有大量忠实用户。对于使用者而言，掌握提现流程显得尤为关键。想要成功提现，首先需确认账户是否符合相关条件。通常只有当账户余额达到平台设定的最低提现额度时，才能发起提现申请。你可以在河马剧场的个人账户界面中实时查看当前余额状态。一旦余额满足要求，便可进入下一步操作。在应用内部一般设有明确的提现通道，通常位于“个人中心”或“账户设置”等菜单中。点击进入提现页面后，需要填写相应的提现信息。这包括选择提现方式，例如绑定银行卡或其他平台支持的支付工具。务必准确输入银

2025-12-19 08:07:14

893

抖音矩阵企业号怎么做？做矩阵企业号有什么好处？企业在抖音平台布局多个账号，通过协同运作达成品牌曝光强化、流量高效转化及用户长期留存的目标，已成为当前数字营销的关键路径。那么，如何科学构建并运营抖音矩阵企业号？一、抖音矩阵企业号落地实操指南清晰界定各账号角色与功能边界企业应围绕核心业务目标，系统性划分账号定位。主账号承担品牌整体形象塑造与重大事件发布职能；子账号则按垂直维度细分，专注特定场景或人群。以护肤品牌为例，可搭建“品牌主号”“成分实验室号”“真实用户日记号”，三者内容互为补充、逻辑自洽。构建统一识别体系，兼顾个性表达制定标准化视觉语言

2025-12-19 08:06:13

654

51漫画网页版导航入口_51漫画在线阅读账号入口 51漫画网页版导航入口为https://www.51manhua.com/，平台提供海量国内外题材漫画、流畅阅读体验及互动功能。

2025-12-19 08:06:07

342

《全民健走》注销账号方法如何在《全民健走》中注销账号？1、进入“我的”页面，点击右上角的“设置”图标；2、在设置界面中，选择“账号安全”选项；3、进入账号安全页后，找到并点击“账号注销”按钮即可开始注销流程。

2025-12-19 08:05:20

567

《雷电模拟器》复制模拟器方法雷电模拟器如何复制模拟器？1、进入雷电模拟器主界面后，点击“雷电多开器”，进入多开管理界面。2、在多开器中，选择“新建/复制模拟器”功能。3、在弹出的窗口中会看到两个选项：新建模拟器与复制模拟器。此时请选择“复制模拟器”即可完成操作。

2025-12-19 08:05:14

952

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Git 教程

20200次学习
收藏
Git版本控制工具

14834次学习
收藏
Git中文开发手册

0次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部