Python如何实现语音识别？SpeechRecognition库实战教程

絕刀狂花

发布时间：2025-07-16 16:25:02

960人浏览过

来源于php中文网

原创

语音识别在python中并不难，主要通过speechrecognition库实现。1. 安装speechrecognition和依赖：执行pip install speechrecognition及pip install pyaudio，linux或macos可能需额外安装portaudio开发库。2. 实时录音识别：导入模块并创建recognizer对象，使用microphone监听音频，调用recognize_google方法进行识别，支持中文需加language="zh-cn"参数。3. 处理本地音频文件：使用audiofile读取wav文件，同样调用识别引擎处理。4. 可选识别引擎包括cmu sphinx（离线识别）、google cloud speech（付费api）等，可根据需求选择。5. 识别出错时可调整参数如adjust_for_ambient_noise、timeout、phrase_time_limit以优化效果。掌握这些步骤即可实现基础语音助手或控制程序。

Python如何实现语音识别？SpeechRecognition库实战教程

语音识别在Python里其实没有想象中那么难，尤其是有了SpeechRecognition这个库之后。它封装了多种语音识别引擎和API，能让你用几行代码就把音频转成文字。

安装SpeechRecognition和依赖项

要使用SpeechRecognition，首先得安装它本身以及相关的依赖。最基础的命令是：

pip install SpeechRecognition

但光这样还不行，因为默认情况下它不带语音识别引擎。如果你打算用Google Web Speech API（免费、无需注册），还需要安装pyaudio来获取麦克风输入：

立即学习“Python免费学习笔记（深入）”；

pip install pyaudio

注意：在Linux或macOS上可能需要额外安装PortAudio开发库才能编译PyAudio。

从麦克风录音并识别

这是最常用也最有意思的部分——实时听你说话然后识别出来。步骤大致如下：

导入模块并创建Recognizer对象
使用Microphone作为源来监听音频
用recognize_google方法进行识别

示例代码：

import speech_recognition as sr

r = sr.Recognizer()
with sr.Microphone() as source:
    print("请说话...")
    audio = r.listen(source)

try:
    text = r.recognize_google(audio, language="zh-CN")
    print("你说的是：" + text)
except sr.UnknownValueError:
    print("无法识别音频")
except sr.RequestError as e:
    print(f"请求出错；{e}")

这段代码会监听一次麦克风输入，然后调用Google的API进行识别。如果你希望支持中文，记得加上language="zh-CN"参数。

MiniMax Agent

MiniMax平台推出的Agent智能体助手

下载

处理本地音频文件

除了实时录音，SpeechRecognition也能处理WAV格式的音频文件。其他格式比如MP3需要先转换一下。

步骤类似，只是把Microphone换成AudioFile：

with sr.AudioFile('example.wav') as source:
    audio = r.record(source)  # 读取整个文件

然后同样用recognize_google或者其他引擎去识别。这种方法适合做批量语音转文字的任务，比如会议记录、视频字幕提取等。

可选识别引擎和注意事项

SpeechRecognition支持多个引擎，比如CMU Sphinx（本地识别，不需要联网）、Google Cloud Speech（需付费API密钥）、Microsoft Bing Voice Recognition等。

常用的几个方式对比：

Google Web Speech API：免费，简单好用，但识别中文有时候不太准
CMU Sphinx：离线可用，速度快，但准确率略低
Google Cloud Speech：更强大，支持更多语言和高级功能，但需要网络+付费授权

另外，如果识别不出来或者总是出错，可以尝试调整以下参数：

adjust_for_ambient_noise()：用于消除背景噪音
timeout和phrase_time_limit：控制监听时间长度
提高录音质量或改用外接麦克风

基本上就这些。掌握这几个关键点，就能用Python做出一个简单的语音助手或者语音控制程序了。

怎么看有没有装python

python3怎么下载

linux如何打开python

linux中如何使用python

如何让vim支持python3

相关标签:

linux python macos bing cos Python pip 封装对象 macos microsoft linux sphinx

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：使用 Flet 在 Python Banner 中动态显示文本的教程下一篇：使用 self 参数的原因：Python 类方法详解

作者最新文章

php如何调用api接口_php调用api接口curl用法【接口】

2026-01-14 17:27

HTML5如何统一表单风格_HTML5统一表单风格方案【基础】

2026-01-14 17:33

php怎样获取当前url_php获取当前url参数拼接【url】

2026-01-14 17:35

php远程访问文件怎么打开_php远程日志文件读取分析【运维】

2026-01-14 17:41

PHP如何指定自定义解释器路径_PHP指定自定义解释器路径法【路径】

2026-01-14 17:44

phpinfo输出会含Cookie吗_检查phpinfo与Cookie关联法【查验】

2026-01-14 17:46

PHP如何创建分区表_PHP创建分区表策略【进阶】

2026-01-14 17:47

Win11怎么关闭触控笔压感_Win11关闭触控笔压感设置【关触感】

2026-01-14 17:51

TV浏览器官方网站登录电视浏览器在线体验平台

2026-01-14 17:56

php远程访问文件怎么打开_php远程ini文件读取解析法【配置】

2026-01-14 17:59

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

751

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

636

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

758

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

618

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1262

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

706

2023.08.11