
美团近日推出了一款基于混合专家(MoE)架构的大型推理模型——LongCat-Flash-Thinking,该模型总参数规模高达5600亿,能够根据输入上下文动态激活186亿到313亿不等的参数,平均激活参数量约为270亿,兼顾性能与效率。
这款模型在逻辑推理、数学解题、编程能力以及Agent类任务中展现出卓越表现。官方数据显示,在AIME25等复杂任务上,借助原生工具调用能力,仅需消耗原有方案64.5%的token即可达到顶尖准确率,显著提升推理效率。
据公开评测结果,LongCat-Flash-Thinking在多个权威基准测试中与主流先进模型展开对比,在数学推理(如MATH500、AIME25)、通用知识问答(如GPQA-Diamond)、代码生成(LiveCodeBench、OJBench)、智能体任务执行(SWE-Bench、τ²-Bench)以及形式化定理证明(MiniF2F-Test)等多个维度均达到了接近领先水平的表现。
值得一提的是,LongCat-Flash-Thinking已依据MIT许可证全面开源模型权重,支持自由使用与研究。同时,官方发布了完整的对话模板,并将模型部署至其官方网站,供用户直接体验。
https://www.php.cn/link/4bac3882938ce191ce0436d7bf533c62
https://www.php.cn/link/7609cb245858fd9cdafcb5f5e1de6602
源码地址:点击下载
以上就是美团开源推理大模型 LongCat-Flash-Thinking的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号