Nemotron 3— 英伟达推出的最新开源AI模型系列-人工智能-PHP中文网

Nemotron 3— 英伟达推出的最新开源AI模型系列

碧海醫心

发布： 2025-12-17 12:39:02

原创

781人浏览过

Nemotron 3 是什么

nemotron 3 是 nvidia 正式发布的全新一代开源大模型家族，涵盖 nano、super 和 ultra 三大规格版本。该系列基于创新的混合专家（mixture of experts, moe）架构设计，旨在赋能高效、高精度的多智能体 ai 系统构建。其中，nemotron 3 nano 拥有 300 亿参数，通过算法与硬件协同优化，在显著压缩推理开销的同时，吞吐量较上一代提升达 4 倍，适用于代码调试、文档摘要等轻量级但高频的任务场景；super 与 ultra 版本则分别搭载 1000 亿和 5000 亿参数，面向高复杂度推理、跨角色协同及大规模多智能体系统部署。nemotron 3 同步开放海量高质量训练语料与配套开发工具链，大幅降低专业 ai 应用的研发门槛，加速多智能体技术在产业端的落地进程。

Topaz Video AI

一款工业级别的视频增强软件

511

查看详情

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
Nemotron 3 的核心能力

极致推理效率：Nemotron 3 Nano 凭借 300 亿参数规模与动态稀疏激活的 MoE 结构，实现单位算力下高达前代 4 倍的响应吞吐，显著压降部署成本。
原生多智能体支持：Super 与 Ultra 版本依托超大规模参数量与结构化协作机制，可支撑需多角色分工、长程规划与实时交互的复杂智能体系统。
超长上下文理解：Nano 版本支持最高达 100 万 token 的上下文窗口，在处理法律文书、技术白皮书、长篇对话等任务时，有效保障语义连贯性与信息完整性。
高鲁棒性推理表现：融合前沿强化学习范式，并在多样化仿真环境与真实场景中并行训练，使模型在逻辑推演、错误识别与策略生成等维度具备更强泛化能力与稳定性。

Nemotron 3 的核心技术机制

动态稀疏 MoE 架构：Nemotron 3 Nano 采用精细化路由控制的 MoE 设计，每次前向计算仅激活约 30 亿参数（占总参数 10%），在维持高性能的同时大幅削减显存占用与延迟。
多环境强化学习训练框架：模型在覆盖编程、数学、自然语言理解等多领域的异构环境中同步开展强化学习训练，持续提升决策质量与环境适应力。
NVFP4 低比特训练技术：Super 与 Ultra 版本全面采用 NVIDIA 自研的 4-bit NVFP4 训练格式，在减少显存消耗与通信带宽需求的同时，精度损失趋近于零，训练速度显著加快。
万亿级高质量训练语料库：提供总计 3 万亿 token 的预训练、监督微调与 RLHF 数据集，涵盖代码、科学文献、多步骤任务流程及领域垂类样本，为专业化模型定制提供坚实基础。