2026年1月22日,百度正式发布并上线原生全模态大模型——文心5.0正式版。该模型参数规模达2.4万亿,基于原生全模态统一建模架构,全面支持文本、图像、音频、视频等多类型信息的跨模态理解与生成。
当前,普通用户可通过文心APP及文心一言官网直接体验;企业客户与开发者则可登录百度千帆平台进行模型调用与集成。

https://www.php.cn/link/efbd304f121218045cb7032edcc74b9f
https://www.php.cn/link/a7bcf3bc23946c7d69a73acb147ca8e8
据官方披露,在涵盖语言理解、视觉推理、跨模态对齐等在内的40多项国际权威基准测试中,文心5.0正式版在综合能力上已超越Gemini-2.5-Pro、GPT-5-High等前沿模型,稳居全球第一梯队。其图像与视频生成质量媲美专业垂直领域模型,整体技术水平处于世界领先行列。




百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜指出,区别于行业主流的“后期融合”式多模态方案,文心5.0采用统一自回归架构实现原生全模态建模,将文本、图像、视频、音频等多种模态数据纳入同一训练框架,完成端到端联合优化,从而实现真正意义上的跨模态深度融合与协同表达。

值得一提的是,文心5.0还引入超大规模混合专家(MoE)结构,具备极高的参数稀疏性,实际激活参数占比低于3%,在保障强大性能的同时显著提升推理效率。此外,模型依托海量工具交互环境,合成高质量长程任务轨迹数据,并结合思维链(Chain-of-Thought)与行动链(Chain-of-Action)驱动的端到端多轮强化学习策略,大幅增强其作为智能体的任务规划与工具调用能力。
早在2025年11月,百度即推出文心大模型5.0 Preview版本并开放试用。此后,该系列模型多次登顶LMArena全球大模型竞技场,在文本理解与视觉感知双榜单中持续位列国内榜首,并成功跻身国际顶尖水平阵营。

1月15日最新排名显示,文心5.0以1460分高居LMArena文本榜国内首位、全球第八位,表现优于GPT-5.1-High、Gemini-2.5-Pro等国内外主流竞品模型。
源码地址:点击下载









