美团正式发布并开源 LongCat-Flash-Chat-IT新闻-PHP中文网

美团正式发布并开源 LongCat-Flash-Chat

花韻仙語

发布： 2025-09-01 13:06:13

原创

304人浏览过

美团正式推出 longcat-flash-chat，并宣布全面开源。该模型基于创新的混合专家系统（mixture-of-experts, moe）架构，总参数规模达 560b，实际激活参数范围为 18.6b~31.3b（平均约 27b），在保障高性能的同时显著提升了计算效率。

评测结果显示，LongCat-Flash-Chat 作为一款非推理型基础模型，在仅激活少量参数的情况下，整体表现可与当前主流领先模型相媲美，尤其在智能体任务中展现出卓越能力。得益于专为推理效率优化的架构设计，其响应速度大幅提升，特别适用于需要长时间运行的复杂智能体应用场景。

核心技术优势

LongCat-Flash 引入了“零计算专家（Zero-Computation Experts）”机制，模型总参数高达 560B，但每个 token 处理时仅根据上下文动态激活 18.6B 至 31.3B 参数，实现算力资源的精准调度与高效使用。为控制整体计算开销，训练过程中引入 PID 控制器实时调节专家层偏置，确保单个 token 的平均激活参数稳定在约 27B。

模型还设计了跨层通信通道，大幅提升了 MoE 架构下计算与通信的并行度，显著增强训练和推理效率。结合定制化的底层系统优化，LongCat-Flash 在 30 天内即完成高效训练，并在 H800 硬件平台上实现超过 100 tokens/s 的用户端推理速度。此外，团队对主流大模型组件和训练流程进行了多项改进，采用超参迁移与模型层叠加策略，配合多种稳定性保障手段，确保训练过程平稳高效。

针对智能体能力的提升，LongCat-Flash 自主构建了 Agentic 评测集以指导数据筛选与训练策略优化，采用多智能体协同生成机制产出丰富且高质量的行为轨迹数据，在整个训练链路中深度优化智能体表现，最终实现行业领先的 Agentic 能力。

通过算法与工程系统的协同创新，LongCat-Flash 在理论成本与推理速度上均超越同级别甚至更小规模的现有模型；经系统级优化后，在 H800 上实现 100 tokens/s 的生成速率，同时将输出成本压缩至仅 5元/百万 token。

千面视频动捕

千面视频动捕是一个AI视频动捕解决方案，专注于将视频中的人体关节二维信息转化为三维模型动作。

173

查看详情

性能表现

美团正式发布并开源 LongCat-Flash-Chat

在通用知识能力方面，LongCat-Flash 表现强劲：ArenaHard-V2 基准测试得分高达 86.50，位居参评模型第二，展现出在高难度一对一评测中的稳定竞争力。在基础能力测试中同样表现出色，MMLU 得分为 89.71，CEval 达到 90.44，整体水平与国内顶尖模型相当，且参数量少于 DeepSeek-V3.1、Kimi-K2 等同类产品，凸显其高效性。
在智能体工具调用方面，LongCat-Flash 具备明显领先优势：即使面对参数规模更大的模型，其在 τ2-Bench 工具使用基准中仍表现更优；在高复杂度任务场景下，于 VitaBench 基准测试中以 24.30 分高居榜首，充分验证其在复杂智能体任务中的强大执行能力。
在编程能力方面，LongCat-Flash 实力扎实：TerminalBench（终端命令任务）得分为 39.51，排名第二，体现其在真实智能体操作场景下的熟练度；SWE-Bench-Verified 测试中得分 60.4，具备较强的实际工程问题解决能力。
在指令遵循能力方面，LongCat-Flash 表现尤为突出：IFEval 基准测试得分 89.65，位列第一，表明其在处理复杂、精细指令时具备极高可靠性；同时在 COLLIE（中文指令遵循）和 Meeseeks-zh（中文多场景指令）评测中分别取得 57.10 和 43.03 的最佳成绩，充分展示其在中英文双语环境下对多样化高难度指令的精准理解与执行能力。

部署方案

官方同步提供基于 SGLang 和 vLLM 的两种高效部署方式。以下为使用 SGLang 在单机环境下部署的示例命令：

python3 -m sglang.launch_server \``    --model meituan-longcat/LongCat-Flash-Chat-FP8 \``    --trust-remote-code \``    --attention-backend flashinfer \``    --enable-ep-moe \``    --tp 8

登录后复制

源码地址：点击下载

以上就是美团正式发布并开源 LongCat-Flash-Chat的详细内容，更多请关注php中文网其它相关文章！