北大张牧涵团队依托昇腾突破推理效率瓶颈大模型推理百万tokens成本仅1 元

絕刀狂花

发布时间：2025-07-29 10:32:01

1047人浏览过

来源于php中文网

原创

在人工智能领域，大语言模型的训练与推理开销长期制约着技术的广泛应用。近期，北京大学人工智能研究院助理教授张牧涵领衔的团队，在鲲鹏昇腾科教创新卓越中心（简称“卓越中心”）提供的强大算力支持下，成功构建了一套高效的大模型训练与推理架构，实现百万tokens输入成本低至1元，为行业提供了高性能、低成本的新范式。

该研究取得了三项核心技术突破。其一，当前主流的相对位置编码机制存在显著稀疏问题。团队创新性地将注意力头中的位置信息与非位置信息进行分离处理，对位置编码实施低秩压缩，在仅保留3%位置信息的情况下仍能保持原有的表达能力。该方案结合昇腾硬件优化的flash-attention算子，大幅提升了注意力头参数的利用效率。

其二，传统模型中非位置编码部分往往处于被压制状态。通过分离位置与非位置成分，非位置编码获得了更大的压缩潜力。研究团队采用联合KV的低秩压缩策略，仅需保留12.5%的KVCache即可维持模型性能。这一方法有效释放了昇腾芯片强大的计算潜能，缓解内存访问瓶颈，显著增强了推理吞吐能力。

其三，依托昇腾平台卓越的并行计算能力，团队研发出RecurrentDecoding（RD）技术，替代传统LM-head结构，从而提升训练数据利用率并加速推理过程。在训练阶段，RD通过对比解码生成的多个tokens与目标tokens，实现更高效的训练数据利用；在推理阶段，结合投机采样机制，显著提高token生成的命中率，进一步加快输出速度。

跃问视频

阶跃星辰推出的AI视频生成工具

下载

此项成果已引发学术界高度关注，不仅为后续研究提供了可复现的高效架构模板，也极大降低了大模型在企业场景中的部署门槛。自2023年6月成立以来，北京大学与华为持续深化在前沿技术领域的协同攻关，此次突破充分验证了昇腾算力平台支撑高水平科研的能力。未来，卓越中心将持续推进大模型关键技术的创新探索，助力构建自主可控的技术生态体系。

北大张牧涵团队依托昇腾突破推理效率瓶颈大模型推理百万tokens成本仅1 元

《逆战：未来》上线！耕升RTX 5070 Ti 踏雪 OC 2.0解锁新鲜情怀体验

内存价格降不下来的原因找到了：产能仅增长5% 缺货达50%

今年产能已售罄！AMD、Intel服务器CPU均计划涨价15%

海外爆火的Sound Party来了！小米蓝牙音箱 Pro发布：599元、3D幻彩灯光超炫酷

内存市场彻底乱套！DDR3主板销量疯涨2-3倍：离DDR2不远了

相关标签:

新闻资讯架构 Token 人工智能

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：共铸高质量智赢高价值 2025华为中国数字能源创新峰会·云南成功举办下一篇：现在买折叠屏哪款有优惠？现在正是联想moto“抄底价”上车的最佳时机！

作者最新文章

Illustrator怎样导入PS_Illustrator文件转PS可用方法【流程】

2026-01-16 21:38

Win11如何通过系统配置实用程序优化启动项_Win11优启项配置法【优化】

2026-01-16 21:39

文心一格如何造赛博朋克插画_文心一格赛博绘制技【窍门】

2026-01-16 21:43

Win11怎样让杀毒软件开机自启且优先_Win11杀毒优先启设置法【安全】

2026-01-16 21:45

PlaygroundAI怎样切换多种色系_PlaygroundAI切换色系方式【方式】

2026-01-16 21:50

Win10怎样让办公软件开机自启不干扰_Win10办公启项干扰解决法【适配】

2026-01-16 21:52

AdobeSensei如何合并图层_AdobeSensei合并图层高效方案【攻略】

2026-01-16 21:53

Win7安装后分辨率低看不清怎么办_显卡驱动安装与最佳设置法【说明】

2026-01-16 21:59

Win10如何关闭用户账户控制弹窗_Win10关UAC弹窗措施【对策】

2026-01-16 22:05

Win10怎样修复损坏的开机启动项配置_Win10修坏启项配置法【修复】

2026-01-16 22:06

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

登录token无效

登录token无效解决方法：1、检查token的有效期限，如果token已经过期，需要重新获取一个新的token；2、检查token的签名，如果签名不正确，需要重新获取一个新的token；3、检查密钥的正确性，如果密钥不正确，需要重新获取一个新的token；4、使用HTTPS协议传输token，建议使用HTTPS协议进行传输；5、使用双因素认证，双因素认证可以提高账户的安全性。

6090

2023.09.14

登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容，供大家免费下载体验。

805

2023.09.14