js如何实现语音识别 Web Speech API实战应用

下次还敢

发布时间：2025-06-28 19:22:01

1232人浏览过

来源于php中文网

原创

javascript 可以通过 web speech api 实现语音识别，其核心接口为 speechrecognition。具体步骤如下：1. 创建 speechrecognition 对象并兼容不同浏览器前缀；2. 设置语言、连续识别模式及是否返回中间结果；3. 监听 start、result、end 和 error 等事件；4. 调用 start() 开始识别，stop() 停止识别。错误处理可通过 onerror 事件捕获常见错误类型并提示用户，如 no-speech、not-allowed、network 等。提高准确率的方法包括优化环境、清晰发音、调整语速、使用高质量麦克风及限制识别语法范围。web speech api 兼容性较好支持 chrome 和 edge，firefox 和 safari 支持较弱，不支持时可考虑第三方服务如 google cloud 或 azure speech services。

js如何实现语音识别 Web Speech API实战应用

实现语音识别，JavaScript 可以借助 Web Speech API，它提供了浏览器内置的语音识别能力，无需依赖外部库或服务。

解决方案

Web Speech API 主要包含两个接口：SpeechRecognition 和 SpeechSynthesis。前者用于语音识别，后者用于语音合成（文本转语音）。这里我们重点关注 SpeechRecognition。

基本步骤：

创建 SpeechRecognition 对象：
```
const recognition = new (window.SpeechRecognition || window.webkitSpeechRecognition)();
```
这里使用了 window.SpeechRecognition || window.webkitSpeechRecognition，是因为 Chrome 早期版本使用的是带有 webkit 前缀的接口。
设置语言：
```
recognition.lang = 'zh-CN'; // 设置为中文
```
可以根据需要设置为其他语言。
设置连续识别模式（可选）：
```
recognition.continuous = false; // 默认是 false，设置为 true 可以进行连续识别
```
连续识别模式下，识别器会一直监听语音输入，直到手动停止。
设置是否返回中间结果（可选）：
```
recognition.interimResults = false; // 默认是 false，设置为 true 可以返回中间结果
```
中间结果是指在语音识别过程中，识别器返回的初步结果，这些结果可能会随着语音的继续输入而发生变化。
监听事件：
- start: 识别器开始监听语音输入时触发。
- result: 识别器识别到语音时触发，返回识别结果。
- end: 识别器停止监听语音输入时触发。
- error: 发生错误时触发。
开始识别：

Timely
一款AI时间跟踪管理工具！

下载
```
recognition.start();
```
停止识别：
```
recognition.stop();
```

示例代码：

const recognition = new (window.SpeechRecognition || window.webkitSpeechRecognition)();
recognition.lang = 'zh-CN';
recognition.interimResults = false;
recognition.maxAlternatives = 1; // 设置返回的最大备选结果数量，默认为 1

document.querySelector('button').addEventListener('click', () => {
  recognition.start();
});

recognition.onresult = (event) => {
  const result = event.results[0][0].transcript;
  console.log('识别结果：' + result);
  document.getElementById('output').textContent = result;
}

recognition.onerror = (event) => {
  console.error('语音识别出错：' + event.error);
};

recognition.onstart = () => {
    console.log("语音识别已启动");
}

recognition.onend = () => {
    console.log("语音识别已结束");
}

这个例子中，点击按钮会启动语音识别，识别结果会显示在 id 为 output 的元素中。

如何处理语音识别的错误？

语音识别出错很常见，网络问题、麦克风权限、浏览器兼容性等等都可能导致错误。 SpeechRecognition 对象的 onerror 事件可以捕获这些错误。

常见的错误类型：

no-speech: 没有检测到语音输入。
aborted: 识别被中止。
audio-capture: 无法获取音频输入。
network: 网络错误。
not-allowed: 没有权限使用麦克风。
service-unavailable: 语音识别服务不可用。
bad-grammar: 语法错误。
language-not-supported: 不支持的语言。

处理方法：

在 onerror 事件处理函数中，可以根据 event.error 的值来判断错误类型，并采取相应的措施。比如，如果错误类型是 not-allowed，可以提示用户检查麦克风权限。如果错误类型是 network，可以提示用户检查网络连接。

recognition.onerror = (event) => {
  console.error('语音识别出错：' + event.error);
  switch (event.error) {
    case 'no-speech':
      alert('没有检测到语音，请重试。');
      break;
    case 'network':
      alert('网络错误，请检查网络连接。');
      break;
    case 'not-allowed':
      alert('请允许浏览器使用麦克风。');
      break;
    default:
      alert('发生未知错误，请重试。');
  }
};

如何提高语音识别的准确率？

语音识别的准确率受到很多因素的影响，比如环境噪音、口音、语速等等。可以尝试以下方法来提高准确率：

优化环境： 尽量在安静的环境中使用语音识别，避免噪音干扰。
清晰发音： 尽量用清晰、标准的普通话发音。
调整语速： 语速不宜过快或过慢，保持适中。
使用合适的麦克风： 高质量的麦克风可以提高音频质量，从而提高识别准确率。
使用 Web Speech API 的高级特性： 比如，可以使用 SpeechGrammarList 对象来指定语法，限制识别范围，从而提高准确率。

关于 SpeechGrammarList:

SpeechGrammarList 可以用来定义一组语法，告诉识别器只识别这些语法中的内容。比如，可以定义一组命令，让识别器只识别这些命令。

const grammar = '#JSGF V1.0; grammar colors; public  = red | green | blue | yellow | purple ;'
const speechRecognitionList = new (window.SpeechGrammarList || window.webkitSpeechGrammarList)();
speechRecognitionList.addFromString(grammar, 1);
recognition.grammars = speechRecognitionList;

这段代码定义了一个名为 colors 的语法，它包含 red, green, blue, yellow, purple 这几个颜色。然后，将这个语法添加到 SpeechRecognition 对象的 grammars 属性中。这样，识别器就只会识别这几个颜色。

Web Speech API 的兼容性如何？

Web Speech API 的兼容性取决于浏览器。目前，Chrome 和 Edge 对 Web Speech API 的支持较好，Firefox 和 Safari 的支持相对较弱。可以使用 window.SpeechRecognition 和 window.SpeechGrammarList 来检测浏览器是否支持 Web Speech API。

if ('SpeechRecognition' in window) {
  // 支持 Web Speech API
  console.log('支持 Web Speech API');
} else {
  // 不支持 Web Speech API
  console.log('不支持 Web Speech API');
  alert('您的浏览器不支持 Web Speech API，请更换浏览器。');
}

如果浏览器不支持 Web Speech API，可以考虑使用第三方的语音识别库，比如 Google Cloud Speech-to-Text API、Microsoft Azure Speech Services 等。这些第三方库通常提供更强大的功能和更高的准确率，但也需要付费使用。

javascript的箭头函数与传统函数有何区别_语法、this与适用场景分析【教程】

javascript的解构赋值如何使用_它如何简化从数组或对象中提取数据【教程】

什么是JavaScript中的国际化与本地化_使用Intl对象处理多语言支持【教程】

如何基于指定表头列（如 TYPE）高亮重复值单元格

如何基于指定表头（）定位列并高亮重复值单元格

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：js怎样实现人脸检测功能浏览器人脸检测的4种实现方案下一篇：如何检测元素是否在视口内？

作者最新文章

c++中如何使用结构体_c++ struct定义与初始化方法【实例】

2026-01-17 11:07

15厘米等于多少英寸 15cm是多少英寸长度【换算】

2026-01-17 11:09

中国移动app在哪里交话费中国移动app在线充值指南【详解】

2026-01-17 11:10

电脑开机密码忘了怎么办？无需重装系统解锁电脑【方法】

2026-01-17 11:11

PR怎么给视频降噪 Premiere音频降噪处理技巧【教程】

2026-01-17 11:12

电脑右下角喇叭图标不见了怎么找回_电脑没声音解决方法【介绍】

2026-01-17 11:13

c++中如何使用std::is_sorted算法_c++检查容器是否有序【详解】

2026-01-17 11:17

c++怎么调用LibTorch运行深度学习模型_c++ PyTorch模型加载与推理【案例】

2026-01-17 11:17

PPT怎么插入特殊符号 PPT添加勾选框或数学符号方法【零基础】

2026-01-17 11:18

PPT怎么做南丁格尔玫瑰图 PPT高级图表制作方法【干货】

2026-01-17 11:19

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

js获取数组长度的方法

在js中，可以利用array对象的length属性来获取数组长度，该属性可设置或返回数组中元素的数目，只需要使用“array.length”语句即可返回表示数组对象的元素个数的数值，也就是长度值。php中文网还提供JavaScript数组的相关下载、相关课程等内容，供大家免费下载使用。

556

2023.06.20

js刷新当前页面

js刷新当前页面的方法：1、reload方法，该方法强迫浏览器刷新当前页面，语法为“location.reload([bForceGet]) ”；2、replace方法，该方法通过指定URL替换当前缓存在历史里（客户端）的项目，因此当使用replace方法之后，不能通过“前进”和“后退”来访问已经被替换的URL，语法为“location.replace(URL) ”。php中文网为大家带来了js刷新当前页面的相关知识、以及相关文章等内容

374

2023.07.04

js四舍五入

js四舍五入的方法：1、tofixed方法，可把 Number 四舍五入为指定小数位数的数字；2、round() 方法，可把一个数字舍入为最接近的整数。php中文网为大家带来了js四舍五入的相关知识、以及相关文章等内容

732

2023.07.04

js删除节点的方法

js删除节点的方法有：1、removeChild()方法，用于从父节点中移除指定的子节点，它需要两个参数，第一个参数是要删除的子节点，第二个参数是父节点；2、parentNode.removeChild()方法，可以直接通过父节点调用来删除子节点；3、remove()方法，可以直接删除节点，而无需指定父节点；4、innerHTML属性，用于删除节点的内容。

477

2023.09.01

JavaScript转义字符

JavaScript中的转义字符是反斜杠和引号，可以在字符串中表示特殊字符或改变字符的含义。本专题为大家提供转义字符相关的文章、下载、课程内容，供大家免费下载体验。

414

2023.09.04

js生成随机数的方法

js生成随机数的方法有：1、使用random函数生成0-1之间的随机数；2、使用random函数和特定范围来生成随机整数；3、使用random函数和round函数生成0-99之间的随机整数；4、使用random函数和其他函数生成更复杂的随机数；5、使用random函数和其他函数生成范围内的随机小数；6、使用random函数和其他函数生成范围内的随机整数或小数。

991

2023.09.04

如何启用JavaScript

JavaScript启用方法有内联脚本、内部脚本、外部脚本和异步加载。详细介绍：1、内联脚本是将JavaScript代码直接嵌入到HTML标签中；2、内部脚本是将JavaScript代码放置在HTML文件的`<script>`标签中；3、外部脚本是将JavaScript代码放置在一个独立的文件；4、外部脚本是将JavaScript代码放置在一个独立的文件。

658

2023.09.12

Js中Symbol类详解

javascript中的Symbol数据类型是一种基本数据类型，用于表示独一无二的值。Symbol的特点：1、独一无二，每个Symbol值都是唯一的，不会与其他任何值相等；2、不可变性，Symbol值一旦创建，就不能修改或者重新赋值；3、隐藏性，Symbol值不会被隐式转换为其他类型；4、无法枚举，Symbol值作为对象的属性名时，默认是不可枚举的。

553

2023.09.20

PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践，涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例，帮助开发者掌握使用 PHP 构建实时通信与推送服务的完整开发流程，适用于即时消息与高互动性应用场景。

2026.01.19

热门下载

网站特效

网站源码

网站素材

前端模板