html5如何实现语音识别_ web speech api调用步骤【教程】

星夢妙者

发布时间：2026-01-04 19:02:02

319人浏览过

来源于php中文网

原创

SpeechRecognition 在生产环境基本不可用，因 Chrome 已废弃、Firefox 不支持、Safari 未实现，且需 HTTPS+用户交互+麦克风活动；推荐用 MediaRecorder 录音上传至后端 ASR 服务。

html5如何实现语音识别_ web speech api调用步骤【教程】

Web Speech API 的 SpeechRecognition 接口在绝大多数现代浏览器中**已废弃或默认禁用**，Chrome 自 2023 年起移除了非安全上下文（http://）的支持，且从 Chrome 119 开始，即使在 https:// 下也要求用户显式授权+交互触发，实际落地困难远超教程所写。

为什么 `SpeechRecognition` 在生产环境基本不可用

不是代码写错，而是浏览器策略收紧：

Chrome 已将 SpeechRecognition 标记为 Deprecated，控制台会输出警告；
Firefox 完全不支持该接口（无 window.SpeechRecognition）；
Safari 从未实现 Web Speech API 的语音识别部分；
即使在 HTTPS + 用户点击后调用，Chrome 仍可能因“未检测到有效麦克风活动”而静默失败，且无明确错误码反馈。

替代方案：用 `MediaRecorder` + 后端 ASR 更可靠

绕过浏览器限制的主流做法是采集音频流，上传至 ASR 服务（如 Whisper、Azure Speech、阿里云智能语音），由后端转写。关键步骤如下：

用 navigator.mediaDevices.getUserMedia({ audio: true }) 获取音频流；
用 MediaRecorder 录制为 webm 或 ogg；
停止录制后，将 Blob 转为 ArrayBuffer 或直接 FormData 提交；
后端接收后调用 ASR 接口，返回文本结果。

const mediaRecorder = new MediaRecorder(stream, { mimeType: 'audio/webm' });
let audioChunks = [];
mediaRecorder.ondataavailable = e => audioChunks.push(e.data);
mediaRecorder.onstop = () => {
  const blob = new Blob(audioChunks, { type: 'audio/webm' });
  const formData = new FormData();
  formData.append('audio', blob, 'recording.webm');
  fetch('/api/transcribe', { method: 'POST', body: formData });
};

如果坚持试用 Web Speech API，必须满足这三点

仅限开发调试，且仅在最新 Chrome + HTTPS + 手动交互下可能短暂生效：

Lovart

全球首个AI设计智能体

下载

立即学习“前端免费学习笔记（深入）”；

页面必须通过 https:// 访问（localhost 也被视为安全上下文）；
调用 recognition.start() 必须由用户真实点击事件触发（不能在 setTimeout 或 load 回调中自动启动）；
需监听 onend 并在每次结束时手动调用 start()，否则识别只执行一次。

const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition;
const recognition = new SpeechRecognition();
recognition.continuous = true;
recognition.interimResults = true;

document.getElementById('start-btn').onclick = () => {
  recognition.start(); // 必须在此处调用
};

recognition.onresult = (event) => {
  const transcript = Array.from(event.results)
    .map(result => result[0].transcript)
    .join('');
  console.log(transcript);
};

真正上线的语音输入功能，几乎都放弃了纯前端识别路径——浏览器能力碎片化太严重，权限策略又不断加码，与其反复适配，不如把音频交给专业 ASR 服务处理。音频上传本身开销极小，延迟可控，且准确率、语种、领域适配能力远超浏览器内置引擎。

如何正确通过 data-id 属性实现导航控制与页面区域激活

如何稳定获取 HTML 元素的 data-id 属性并实现导航联动

html文件怎么打开是下载_服务器配置导致无法直接预览怎么办【技巧】

HTML5代码里空格老被吃掉怎么办_保留空格的代码写法【指南】

如何制作 html_HTML网页制作基础步骤与工具推荐【详解】

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：html5怎么固定图片_html5用position或object-fit固定图片位置防偏移【布局】下一篇：HTML5空格在Edge浏览器里显示异常吗_Edge空格兼容处理【操作】

作者最新文章

搜狗搜索如何搜索知乎精选问答_搜狗搜索知乎频道筛选与高赞查看【实操】

2026-01-07 19:12

html5前端怎么用_html5搭页面结构CSS做样式JS加交互做前端开发【使用】

2026-01-07 19:17

html5本地存储localstorage怎么用_数据保存读取操作【解答】

2026-01-07 19:18

html文件怎么打开是下载_服务器配置导致无法直接预览怎么办【技巧】

2026-01-07 19:22

百度搜索怎么避开广告干扰_百度搜索避开广告干扰方法【指南】

2026-01-07 19:40

Win10怎么查看系统更新占用空间 Win10更新空间查看方法【教程】

2026-01-07 19:54

Windows怎样关闭系统更新广告_Windows关闭系统更新广告方法【教程】

2026-01-07 20:11

如何用Grammarly检查年终总结_Grammarly检查年终总结方法【准确】

2026-01-07 20:38

Win11时间怎么设置不同步互联网 Win11关闭时间同步设置【指南】

2026-01-07 20:59

Midjourney怎么用一键生成产品图_Midjourney产品图生成【攻略】

2026-01-07 21:00

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

html5动画制作有哪些制作方法

html5动画制作方法有使用CSS3动画、使用JavaScript动画库、使用HTML5 Canvas等。想了解更多html5动画制作方法相关内容，可以阅读本专题下面的文章。

500

2023.10.23

HTML与HTML5的区别

HTML与HTML5的区别：1、html5支持矢量图形，html本身不支持；2、html5中可临时存储数据，html不行；3、html5新增了许多控件；4、html本身不支持音频和视频，html5支持；5、html无法处理不准确的语法，html5能够处理等等。想了解更多HTML与HTML5的相关内容，可以阅读本专题下面的文章。

421

2024.03.06

html5从入门到精通汇总

想系统掌握HTML5开发？本合集精选全网优质学习资源，涵盖免费教程、实战项目、视频课程与权威电子书，从基础语法到高级特性（Canvas、本地存储、响应式布局等）一应俱全，适合零基础小白到进阶开发者，助你高效入门并精通HTML5前端开发。

2025.12.30

html5新老标签汇总

HTML5在2026年持续优化网页语义化与交互体验，不仅引入了如<header>、<nav>、<article>、<section>、<aside>、<footer>等结构化标签，还新增了<video>、<audio>、<canvas>、<figure>、<time>、<mark>等增强多媒体与

2025.12.30

html5空格代码怎么写

在HTML5中，空格不能直接通过键盘空格键实现，需使用特定代码。本合集详解常用空格写法： （不间断空格）、&ensp;（半个中文空格）、&emsp;（一个中文空格）及CSS的white-space属性等方法，帮助开发者精准控制页面排版，避免因空格失效导致布局错乱，适用于新手入门与实战参考。

2025.12.30

html5怎么做网站教程

想从零开始学做网站？这份《HTML5怎么做网站教程》合集专为新手打造！涵盖HTML5基础语法、页面结构搭建、表单与多媒体嵌入、响应式布局及与CSS3/JavaScript协同开发等核心内容。无需编程基础，手把手教你用纯HTML5创建美观、兼容、移动端友好的现代网页。附实战案例+代码模板，快速上手，轻松迈出Web开发第一步！

101

2025.12.31

HTML5建模教程

想快速掌握HTML5模板搭建？本合集汇集实用HTML5建模教程，从零基础入门到实战开发全覆盖！内容涵盖响应式布局、语义化标签、Canvas绘图、表单验证及移动端适配等核心技能，提供可直接复用的模板结构与代码示例。无需复杂配置，助你高效构建现代网页，轻松上手前端开发！

2025.12.31

html5怎么使用

想快速上手HTML5开发？本合集为你整理最实用的HTML5使用指南！涵盖HTML5基础语法、主流框架（如Bootstrap、Vue、React）集成方法，以及无需安装、直接在线编辑运行的平台推荐（如CodePen、JSFiddle）。无论你是新手还是进阶开发者，都能轻松掌握HTML5网页制作、响应式布局与交互功能开发，零配置开启高效前端编程之旅！

2025.12.31