Speech 2.6— MiniMax推出的语音生成模型-人工智能-PHP中文网

Speech 2.6— MiniMax推出的语音生成模型

霞舞

发布： 2025-10-31 12:11:00

原创

200人浏览过

Speech 2.6是什么

speech 2.6 是由minimax最新发布的语音生成模型，专为构建新一代语音智能体而打造。该模型具备极低的端到端延迟（低于250毫秒），保障实时对话场景下的流畅体验；同时支持多语言环境下的网址、邮箱、电话号码等复杂非标准文本格式直接朗读，无需额外预处理步骤。通过引入 fluent lora 技术，显著提升了语音的韵律自然度与音色还原能力，即使原始语音样本存在口音或表达不流畅，也能输出高品质、更自然的合成语音。目前模型已覆盖40多种语言，广泛适用于智能客服、智能终端设备等多种应用场景。用户可通过minimax开放平台及minimax audio官网便捷接入并使用该模型。

小微助手

微信推出的一款专注于提升桌面效率的助手型AI工具

249

查看详情

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
Speech 2.6的主要功能

超低延迟表现：端到端响应时间控制在250毫秒以内，满足实时语音交互对速度的高要求。
复杂文本智能解析：可直接识别并正确朗读跨语言的网址、电子邮箱、联系电话、日期和金额等非规范文本内容，免除手动标注或转换的繁琐流程。
自然度全面升级 + Fluent LoRA：采用Fluent LoRA技术增强语音流利度与情感表达，提升语调连贯性和节奏感，即便训练数据带有口音或断续，仍能生成清晰自然的语音；支持个性化音色复刻，保留原始声音特征如腔调、语气习惯等。
广泛语言覆盖：支持超过40种语言，助力全球化语音应用部署。
场景化语音输出：针对不同使用需求优化语音表现，适用于新闻播报、智能硬件交互、虚拟助手等多种高交互性场景。