通过Python的speech_recognition库将声音转为文字
文章目录
前言
大家好,我是空空star,本篇给大家分享一下通过Python的speech_recognition库将声音转为文字。
之前已经介绍了将音频文件转为文字,只依赖speech_recognition
库,本篇将声音转为文字,除了speech_recognition
库,还要依赖pyaudio
库,而且mac用户需要安装PortAudio
。
一、PortAudio
1.PortAudio是什么?
PortAudio是一种跨平台的音频I/O库,用于实现音频输入和输出功能。它提供了一种简单、一致的跨平台API,可以让开发者在不同操作系统上编写音频应用程序,如音频录制和播放器。PortAudio支持多种音频设备,包括音频接口、音频文件、网络流等,并且可以在各种操作系统上使用,如Windows、Mac OS X、Linux、Unix等。同时,PortAudio还提供了一些高级特性,如流控制、同步、缓冲管理、音频格式转换等。
2.安装PortAudio
macOS下:
brew install portaudio
二、使用方法
1.引入库
import speech_recognition as sr
2.创建一个Recognizer对象
r = sr.Recognizer()
3.使用麦克风录音,从麦克风录制音频
# 使用麦克风录音with sr.Microphone() as source: print("请说话...") # 从麦克风录制音频 audio = r.listen(source) print("录音结束")
4.将音频转换为文字
try:
# 将音频转换为文字
text = r.recognize_google(audio, language=‘zh-CN’)
print(“你说的是:”, text)
except sr.UnknownValueError:
print(“Google Speech Recognition could not understand audio”)
except sr.RequestError as e:
print(“Could not request results from Google Speech Recognition service; {0}”.format(e))
5.转换结果
声音:深度神经网络模型部署
请说话…
录音结束
你说的是: 深度神经网络模型部署
Process finished with exit code 0
总结
来源地址:https://blog.csdn.net/weixin_38093452/article/details/130626278
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341