腾讯混元图像 3.0 登顶国际“盲测”第一，多模态能力全球领先-人工智能-PHP中文网

腾讯混元图像 3.0 登顶国际“盲测”第一，多模态能力全球领先

蓮花仙者

发布： 2025-11-01 23:23:14

原创

1055人浏览过

近日，国际大模型竞技场lmarena发布了最新的文生图榜单，引发广泛关注。在此次评比中，腾讯混元图像3.0从全球26个主流大模型中脱颖而出，荣登榜首。这一成绩不仅超越了如nano-banana等顶尖闭源模型，更关键的是，排名基于全球用户真实反馈的“盲测”结果，全程无任何算法干预或滤镜加持，每一票都真实反映了用户的使用体验与偏好选择。

LMArena是由美国加州大学伯克利分校推出的创新性AI模型评测平台，其核心评估机制采用基于人类偏好的“盲测”方式。当用户提交问题后，系统会随机提供两个不同模型生成的回答或图像，由用户根据主观感受进行选择。这些累积的投票数据直接决定各模型在排行榜上的位置。凭借庞大的访问量和贴近实际应用场景的评测逻辑，LMArena已成为当前最具公信力的国际AI模型竞技平台之一。

混元图像3.0于9月28日正式发布并全面开源，是全球首个开源的工业级原生多模态图像生成模型，同时也是目前表现最优的开源文生图模型，参数规模高达80B。该模型具备强大的语义理解能力，能够结合常识进行逻辑推理，精准捕捉文本意图，同时在美学表达上达到极致水准，可生成高分辨率、高度真实的视觉内容。此外，它还支持中英文文字嵌入及长文本渲染，极大提升了图文一致性和细节表现力。

目前，混元图像3.0已开放文生图功能，图生图、图像编辑以及多轮交互等功能版本将在后续陆续上线。无论是复杂的漫画创作、趣味表情包设计，还是科普类插画生成，该模型都能高效完成。对于专业视觉创作者而言，原本耗时数小时的手绘工作，如今几分钟内即可实现；而对于缺乏美术基础的内容生产者，也能轻松产出高质量、富有创意的视觉作品。

值得一提的是，混元图像3.0自发布以来广受开发者青睐。上线不久即登上Hugging Face开源社区模型热榜首位，并连续七天稳居第一。此次再登LMArena文生图榜单冠军，进一步印证了其在技术实力与社区影响力方面的双重认可。

Q.AI视频生成工具

支持一分钟生成专业级短视频，多种生成方式，AI视频脚本，在线云编辑，画面自由替换，热门配音媲美真人音色，更多强大功能尽在QAI

220

查看详情

LMArena官方也在其社交平台第一时间发文祝贺：“文生图领域迎来巨变！腾讯混元图像3.0强势登顶——同时斩获‘最佳综合文生图模型’与‘最佳开源文生图模型’双料第一。该模型已超越Seedream 4及代号为‘nano-banana’的Gemini 2.5 Flash Image Preview。”这一里程碑式的成就，标志着混元在多模态生成技术上已迈入世界领先行列。

事实上，多模态能力正日益成为混元大模型的核心优势。早在今年8月，上海人工智能实验室发布的全球3D生成模型评测榜单中，混元3D模型就在图生3D与文生3D两项任务中双双夺冠；其世界模型Voyager也在斯坦福大学WorldScore基准测试中取得综合能力第一名的佳绩。截至目前，混元已构建起覆盖语言、图像、视频、3D的全栈式多模态开源体系，提供接近商业级性能的开源基座模型。其衍生出的图像与视频模型总数已达3000个，混元3D系列模型在社区中的下载量突破260万次，成为全球最受欢迎的开源3D生成模型。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜