首页 > web前端 > js教程 > 正文

如何用JavaScript构建一个语音识别或合成应用?

狼影
发布: 2025-09-26 09:33:01
原创
1014人浏览过
答案:JavaScript通过Web Speech API实现语音识别与合成。使用SpeechRecognition将语音转文本,需HTTPS及浏览器支持,推荐Chrome;通过SpeechSynthesis将文本转语音,可调节语速、音调、音量,适用于朗读与辅助功能。二者结合可用于语音记事本、无障碍工具等场景,注意权限、兼容性与用户体验。

如何用javascript构建一个语音识别或合成应用?

要构建一个语音识别或语音合成应用,JavaScript 提供了浏览器原生支持的 API,分别是 Web Speech API 中的 SpeechRecognition(语音识别)和 SpeechSynthesis(语音合成)。这两个接口让开发者可以轻松实现听写、语音控制、朗读文本等功能。

语音识别:使用 SpeechRecognition

SpeechRecognition 接口允许你将用户的语音转换为文本。虽然目前在部分浏览器中仍需加前缀,但 Chrome 支持较好。

示例代码:

开启语音识别并获取结果:

// 检查浏览器是否支持
const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition;
if (!SpeechRecognition) {
  console.log("当前浏览器不支持语音识别");
}

const recognition = new SpeechRecognition();
recognition.lang = 'zh-CN'; // 设置语言
recognition.interimResults = false; // 是否返回中间结果
recognition.maxAlternatives = 1;

// 开始识别
document.getElementById('start-btn').onclick = () => {
  recognition.start();
};

// 获取结果
recognition.onresult = (event) => {
  const transcript = event.results[0][0].transcript;
  document.getElementById('output').textContent = transcript;
  console.log('识别结果:', transcript);
};

// 错误处理
recognition.onerror = (event) => {
  console.error('识别出错:', event.error);
};
登录后复制

说明与建议:

立即学习Java免费学习笔记(深入)”;

  • 用户首次使用时会弹出麦克风权限请求,需确保页面在 HTTPS 环境下运行。
  • interimResults 设为 true 可实时显示未完成的识别内容。
  • 注意兼容性:Safari 和 Firefox 基本不支持,推荐用于 Chrome 或基于 Chromium 的浏览器。

语音合成:使用 SpeechSynthesis

SpeechSynthesis 接口可以将文本“朗读”出来,适合做语音提示、辅助阅读等场景。

AppMall应用商店
AppMall应用商店

AI应用商店,提供即时交付、按需付费的人工智能应用服务

AppMall应用商店 56
查看详情 AppMall应用商店
示例代码:

让浏览器朗读输入框中的文字:

const synth = window.speechSynthesis;

document.getElementById('speak-btn').onclick = () => {
  const text = document.getElementById('text-input').value;
  if (!text || synth.speaking) return; // 避免重复播放

  const utterance = new SpeechSynthesisUtterance(text);
  utterance.lang = 'zh-CN';
  utterance.rate = 1;   // 语速,0.1 到 10
  utterance.pitch = 1;  // 音调,0 到 2
  utterance.volume = 1; // 音量,0 到 1

  synth.speak(utterance);
};

// 停止朗读
document.getElementById('stop-btn').onclick = () => {
  synth.cancel();
};
登录后复制

进阶技巧:

  • 可通过 speechSynthesis.getVoices() 获取可用语音列表,支持不同性别或语言的发音人。
  • 绑定 utterance.onend 事件可在朗读后执行回调。
  • 部分系统/浏览器对中文语音支持有限,可测试不同设备效果。

实际应用场景建议

结合两个功能,你可以构建如下应用:

  • 语音记事本:用户说话 → 转文字保存;点击按钮 → 文字朗读出来。
  • 无障碍工具:自动朗读网页内容,或通过语音命令导航。
  • 语言学习助手:用户朗读句子 → 识别后比对正确文本;错误时用语音反馈。

开发时注意用户体验:

  • 添加状态提示(如“正在聆听…”、“朗读中”)。
  • 提供手动输入备用方案,避免语音失败导致功能不可用。
  • 控制连续识别频率,防止触发过多请求。
基本上就这些。利用 Web Speech API,无需引入大型框架或服务,就能快速做出实用的语音交互功能。虽然功能受限于浏览器支持,但在合适场景下非常高效。

以上就是如何用JavaScript构建一个语音识别或合成应用?的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号