MiniMax-M1— MiniMax最新开源的推理模型-人工智能-PHP中文网

MiniMax-M1— MiniMax最新开源的推理模型

霞舞

发布： 2025-06-18 17:04:01

原创

470人浏览过

minimax-m1是minimax团队发布的全新开源推理模型，结合了混合专家架构（moe）与闪电注意力机制（lightning attention），总参数规模达到4560亿，每token激活459亿参数。该模型在性能上超越国内主流闭源模型，接近国际顶尖水平，具备极高的性价比。minimax-m1原生支持长达100万token的上下文长度，并提供40k和80k两种推理预算版本，适用于处理长输入和复杂推理任务。基准测试显示，它在多个指标上优于deepseek等开源模型，在软件工程、长上下文理解和工具调用方面表现尤为突出。其高效的计算能力和强大的推理能力为下一代语言模型代理提供了坚实基础。

Ke361开源淘宝客系统

Ke361是一个开源的淘宝客系统，基于最新的ThinkPHP3.2版本开发，提供更方便、更安全的WEB应用开发体验，采用了全新的架构设计和命名空间机制，融合了模块化、驱动化和插件化的设计理念于一体，以帮助想做淘宝客而技术水平不高的朋友。突破了传统淘宝客程序对自动采集商品收费的模式，该程序的自动采集模块对于所有人开放，代码不加密，方便大家修改。集成淘点金组件，自动转换淘宝链接为淘宝客推广链接。K

查看详情

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
MiniMax-M1的核心功能

长文本处理能力：支持100万token输入和8万token输出，适用于处理长文档及复杂推理任务。
高效推理机制：提供40K和80K两个推理预算选项，优化资源使用，降低推理成本。
多领域适应性：在数学推理、软件开发、上下文理解以及工具调用等方面表现出色，满足多种应用场景需求。
结构化函数调用：能够识别并生成外部函数调用参数，便于与外部系统交互。

MiniMax-M1的技术核心

混合专家架构（MoE）：采用MoE结构，将模型划分为多个专家模块，根据输入特征动态分配至不同模块，实现高效计算与并行处理。这种设计使得模型在大规模参数下仍保持良好性能，适合处理复杂任务。
闪电注意力机制（Lightning Attention）：通过优化注意力计算流程，减少冗余运算，显著提升效率。利用稀疏注意力模式，仅关注关键信息，进一步降低计算复杂度，有效支持百万级token上下文处理。
强化学习训练策略：采用大规模强化学习进行训练，基于奖励信号优化输出结果。提出CISPO算法，通过对重要性采样权重裁剪而非token更新，提高训练效率和模型表现。混合注意力设计自然增强了RL训练效果，解决MoE架构在扩展强化学习时的挑战。

MiniMax-M1的性能评测

代码工程能力：在SWE-bench基准测试中，MiniMax-M1-40k和MiniMax-M1-80k分别获得55.6%和56.0%的得分，略低于DeepSeek-R1-0528的57.6%，但远超其他开源模型。
长文本理解能力：凭借百万token上下文窗口，M1系列在长文本理解方面领先所有开源模型，甚至超过OpenAI o3和Claude 4 Opus，全球排名第二，仅次于Gemini 2.5 Pro。
工具调用能力：在TAU-bench评测中，MiniMax-M1-40k在开源模型中排名第一，击败Gemini-2.5 Pro。

MiniMax-M1的项目资源

GitHub仓库地址：https://www.php.cn/link/55670a220c71ceab2e42e57a56c26ae8
HuggingFace模型页面：https://www.php.cn/link/bcd9ecdada91ad9da498b58877cc8f18
技术白皮书：https://www.php.cn/link/55670a220c71ceab2e42e57a56c26ae8/blob/main/MiniMax\_M1\_tech\_report

MiniMax-M1的定价策略

API推理费用标准：
- 0-32k 输入长度：
  - 输入价格：0.8元/百万 token。
  - 输出价格：8元/百万 token。
- 32k-128k 输入长度：
  - 输入价格：1.2元/百万 token。
  - 输出价格：16元/百万 token。
- 128k-1M 输入长度：
  - 输入价格：2.4元/百万 token。
  - 输出价格：24元/百万 token。
APP与网页端服务：在MiniMax APP和Web平台提供不限量免费使用。