首页 > 新闻 > 硬件新闻 > 正文

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练

聖光之護
发布: 2025-09-30 11:42:04
原创
658人浏览过

deepseek v4被曝下月发布:100m上下文 全面用国产ai芯片训练

9月29日,DeepSeek正式推出DeepSeek-V3.2-Exp大模型,距离此前发布DeepSeek-V3.1-Terminus仅过去不久,再次展现了其在重大节点前更新模型的节奏。此次发布的v3.2版本带有“Exp”(Experimental)后缀,表明其主要定位为技术探索性质,并非追求性能全面超越,而是为后续重大升级铺路。

本次更新的核心亮点在于引入了DeepSeek Sparse Attention(DSA),该机制首次实现细粒度稀疏注意力,在几乎不牺牲输出质量的前提下,显著提升了长文本场景下的训练与推理效率,为处理更长上下文和降低计算开销提供了新的技术路径。

尽管V3.2本身属于小步迭代,业界更关注的是传闻中的DeepSeek-V4基座大模型及其可能带来的革命性升级。有推特账号“DeepSeek News Commentary”声称,V4将于10月发布,或将支持高达100万token的上下文长度,采用GRPO驱动推理、NSA/SPCT等新技术,在数学与编程能力上大幅提升,同时具备更快的响应速度和更低的成本。

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练

不过该账号虽位于杭州,但并非官方认证渠道,消息尚未得到证实。尽管如此,10月发布V4并非全无可能——当前V3.2的技术验证正为此积累经验。早在此前,DeepSeek已明确表示下一代模型将支持FP8算法,并全面适配国产AI芯片。

面多多
面多多

面试鸭推出的AI面试训练平台

面多多30
查看详情 面多多

目前,包括华为昇腾、寒武纪、海光信息在内的多家国产芯片厂商均已宣布完成对DeepSeek-V3.2-Exp的适配。特别是华为昇腾,不仅实现了0day支持,还开源了推理代码。结合昇腾近期公布的路线图,预计明年Q1发布的昇腾950PR将支持FP8/FP4等多种精度格式,算力强劲,互联带宽高达2TB/s,内存带宽达4TB/s,堪称国产算力的里程碑产品。

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练

因此,不少观点认为,DeepSeek-V4的最佳亮相时机或与昇腾950PR等先进国产芯片的成熟部署同步。此前已有消息称DeepSeek正在使用国产芯片进行模型训练,V3.2已同时支持CUDA与华为CANN,预示着V4在国产化适配上将更加深入,未来也有望陆续推出针对寒武纪、海光等平台的优化版本。

以上就是DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练的详细内容,更多请关注php中文网其它相关文章!

AI工具
AI工具

AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型,支持联网搜索。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号