Python怎样实现语音识别?SpeechRecognition教程

星夢妙者
发布: 2025-07-13 14:44:02
原创
289人浏览过

语音识别在python中借助speechrecognition库实现非常简便。1. 安装speechrecognition库,使用pip install speechrecognition;2. 若需使用非google api的服务,需额外申请密钥或安装依赖;3. 需安装pyaudio库支持麦克风输入,linuxmacos可能需要特殊处理;4. 使用recognizer和microphone对象获取并识别音频;5. 可通过adjust_for_ambient_noise减少噪音干扰,设置语言参数调整识别语种;6. 支持离线识别和音频文件识别。整个流程简单但需注意环境配置和细节问题。

Python怎样实现语音识别?SpeechRecognition教程

语音识别在Python中其实并不复杂,尤其是借助一些现成的库,比如 SpeechRecognition。它封装了多种语音识别引擎和API,使用起来非常方便,适合初学者快速上手。

Python怎样实现语音识别?SpeechRecognition教程

安装SpeechRecognition

要开始用 SpeechRecognition,首先得安装这个库。一般直接用 pip 安装就可以了:

pip install SpeechRecognition
登录后复制

如果你还想用Google Web Speech API来做实际的识别(默认就是这个),那基本不需要额外配置。但如果你想用其他服务,比如Sphinx、Wit.ai、Bing Voice等,可能还需要申请密钥或者安装额外依赖。

立即学习Python免费学习笔记(深入)”;

Python怎样实现语音识别?SpeechRecognition教程

获取麦克风输入:需要pyaudio

默认情况下,SpeechRecognition 支持从麦克风获取音频,但需要一个叫 pyaudio 的库支持。这一步经常卡人,特别是Windows以外的系统。

你可以尝试用 pip 安装:

Python怎样实现语音识别?SpeechRecognition教程
pip install pyaudio
登录后复制

如果装不上,Linux用户可能需要用 apt-get 安装依赖:

sudo apt-get install python3-pyaudio
登录后复制

macOS用户可能需要用 homebrew 安装 portaudio 再编译安装pyaudio。

最简单的语音识别示例

下面是一个基础例子,它会监听麦克风,然后把你说的话转成文字:

import speech_recognition as sr

r = sr.Recognizer()
with sr.Microphone() as source:
    print("请说话...")
    audio = r.listen(source)

try:
    text = r.recognize_google(audio, language="zh-CN")
    print("你说的是: " + text)
except sr.UnknownValueError:
    print("无法识别音频")
except sr.RequestError as e:
    print("请求出错; {0}".format(e))
登录后复制

这段代码的关键在于:

  • 使用 Recognizer() 创建一个识别器对象
  • 用 Microphone() 上下文管理器来获取音频流
  • 调用 listen() 来监听一次语音输入
  • 最后调用 recognize_google() 进行识别(默认是Google API)

注意:Google的API在国外服务器,网络不好的话可能会失败。可以考虑换别的API,或者加个重试机制。

常见问题和注意事项

  • 环境噪音干扰:可以在录音前加一句 r.adjust_for_ambient_noise(source) 自动校准背景噪音。
  • 识别语言设置:上面例子用了 "zh-CN" 表示中文普通话,英文就换成 "en-US"。
  • 离线识别:如果你想离线识别,可以用CMU Sphinx,不过准确率会低一些。
  • 音频文件识别:不只是麦克风,你也可以读取 .wav 文件进行识别,只需要改成 sr.AudioFile("test.wav") 就行。

基本上就这些。整个流程不算复杂,但有些细节容易忽略,比如pyaudio的安装、网络访问权限这些。遇到问题多看看错误提示,再查文档或Stack Overflow,应该都能解决。

以上就是Python怎样实现语音识别?SpeechRecognition教程的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号