美团正式发布并开源 LongCat-Flash-Omni-IT新闻-PHP中文网

美团正式发布并开源 LongCat-Flash-Omni

碧海醫心

发布： 2025-11-03 17:52:11

原创

911人浏览过

美团宣布 longcat-flash 系列模型迎来新突破，正式推出全新成员——longcat-flash-omni。

美团正式发布并开源 LongCat-Flash-Omni

据悉，LongCat-Flash-Omni 是业内首个集“全模态覆盖、端到端架构、大参数量高效推理”于一身的开源大语言模型。该模型首次在开源领域实现了多模态能力与闭源模型的全面对标，依托创新的架构设计与深度工程优化，使具备大规模参数的模型在处理多模态任务时仍可实现毫秒级响应，有效攻克了行业长期面临的高延迟推理难题。

基于 LongCat-Flash 系列原有的高效结构（Shortcut-Connected MoE，含零计算专家），LongCat-Flash-Omni 进一步融合了高效的多模态感知模块和语音重建技术。即便总参数高达5600亿（激活参数为270亿），依然能够支持低延迟的实时音视频交互，为开发者在复杂多模态场景下的应用落地提供了更加强大且高效的解决方案。

综合评测显示，LongCat-Flash-Omni 在多项全模态基准测试中达到开源模型中的最先进水平（SOTA），并在文本理解、图像识别、视频分析以及语音感知与生成等单项任务中表现出卓越性能，竞争力显著。

作为一款追求极致性能的开源全模态模型，LongCat-Flash-Omni 在统一框架下整合了离线多模态理解与实时音视频交互能力。其采用完全端到端的架构设计，以轻量级视觉与音频编码器作为输入感知模块，由大语言模型直接处理原始输入并生成文本与语音 token，再通过轻量化音频解码器还原为自然语音波形，从而实现流畅、低延时的实时对话体验。