我的编程空间,编程开发者的网络收藏夹
学习永远不晚

python语音唤醒-pocketsph

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

python语音唤醒-pocketsph

使用pocketsphinx模块,实现唤醒词功能。

运行环境:

win10 + Python3.6.2

安装模块包:

地址:https://pypi.org/project/pocketsphinx/

> pip install pocketsphinx
C:\Users\qpf10>pip install pocketsphinx
Collecting pocketsphinx
  Downloading https://files.pythonhosted.org/packages/52/53/30b12c3e4de918e32e73e9d635b4c9e1765512acc94ad0b51bfe960b54c9/pocketsphinx-0.1.15-cp36-cp36m-win_amd64.whl (29.1MB)
    100% |████████████████████████████████| 29.1MB 104kB/s
Installing collected packages: pocketsphinx
Successfully installed pocketsphinx-0.1.15

pypi官方简介:

Pocketsphinx是CMU Sphinx语音识别开源工具包的一部分。
这个包为使用SWIG和Setuptools创建的CMU Sphinxbase和Pocketsphinx库提供了一个python接口。

一、运行官方自带案例-LiveSpeech

原文:It's an iterator class for continuous recognition or keyword search from a microphone.
有道翻译:它是一个迭代器类,用于从麦克风连续识别或关键字搜索。

在pycharm中运行代码,完美运行。

import os
from pocketsphinx import LiveSpeech, get_model_path

model_path = get_model_path()

speech = LiveSpeech(
    verbose=False,
    sampling_rate=16000,
    buffer_size=2048,
    no_search=False,
    full_utt=False,
    hmm=os.path.join(model_path, 'en-us'),
    lm=os.path.join(model_path, 'en-us.lm.bin'),
    dic=os.path.join(model_path, 'cmudict-en-us.dict')
)
for phrase in speech:
    print("phrase:", phrase)
    print(phrase.segments(detailed=True))

运行后,我说了两句(发音不标准),一句hello,一句hello word,显示结果:感觉识别的很有问题。。。虽说不标准,但是不至于这个情况。

Allocating 32 buffers of 2500 samples each
phrase: i'm
[('<s>', -7, 37837, 37890), ('<sil>', -6, 37891, 38010), ("i'm(2)", -913, 38011, 38064), ('[SPEECH]', -6069, 38065, 38070), ('</s>', 0, 38071, 38078)]
phrase: hello or earth
[('<s>', -5, 186767, 186778), ('hello', -9386, 186779, 186834), ('or', -3672, 186835, 186854), ('earth', -1192, 186855, 186904), ('</s>', 0, 186905, 186907)]

二、运行中文语言模型内容

  • 参考博客:
    https://blog.csdn.net/zouxy09/article/details/14222605

添加中文语言模型和中文声学模型

  • 中文相关文件下载地址:
    https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Mandarin/
    1. 声学模型:zh_broadcastnews_16k_ptm256_8000.tar.bz2
    2. 语言模型:zh_broadcastnews_64000_utf8.DMP
    3. 拼音字典:zh_broadcastnews_utf8.dic
  • 拷贝到model文件夹下:

    将文件放到PHTHON_HOME的pocketsphinx模块包下,我这里是在C:\Python36\Lib\site-packages\pocketsphinx\model

放代码:没有变化,只是加载的目录文件变了。

import os
from pocketsphinx import LiveSpeech, get_model_path

model_path = get_model_path()

speech = LiveSpeech(
    verbose=False,
    sampling_rate=16000,
    buffer_size=2048,
    no_search=False,
    full_utt=False,
    hmm=os.path.join(model_path, 'zh/zh_broadcastnews_16k_ptm256_8000'),
    lm=os.path.join(model_path, 'zh/zh_broadcastnews_64000_utf8.DMP'),
    dic=os.path.join(model_path, 'zh/zh_broadcastnews_utf8.dic')
)
for phrase in speech:
    print("phrase:", phrase)
    print(phrase.segments(detailed=True))

运行后的结果,还是非常的不准确。虽说带点东北口音,但是识别的还是挺差的。。。说的,你好,你好吗,滚。还说了挺多其他的,都没有很好的效果,就不贴了。
运行后,半天才反应过来开始识别,不知道是什么原因,刚开始我还以为是程序监听不到语音呢。

Allocating 32 buffers of 2500 samples each
phrase: 尼 尔 奥
[('<s>', 2, 2645708, 2645714), ('尼', -357, 2645715, 2645771), ('尔(2)', -2, 2645772, 2645811), ('奥', -42088, 2645812, 2645853), ('</s>', 0, 2645854, 2645857)]
phrase: 尼 尔 欧盟
[('<s>', -2, 2828757, 2828765), ('尼', -11911, 2828766, 2828782), ('尔(2)', -2519, 2828783, 2828837), ('欧盟', 0, 2828838, 2828868), ('</s>', 0, 2828869, 2828872)]
phrase: 不同
[('<s>', 1, 3023056, 3023061), ('不同', -18424, 3023062, 3023128), ('</s>', 0, 3023129, 3023133)]

还会出现如下这种空的情况- -!:
phrase: 
[('<s>', -4, 6295811, 6295819), ('++incomplete++', 0, 6295820, 6295973), ('</s>', 0, 6295974, 6296015)]

三、运行自定义的中文语言模型内容

这里有个前提:我只把pocketsphinx当做唤醒词来使用。

具体操作步骤

  1. 编辑一个自定义的keyword.txt文本,里面写入打算唤醒的中文词语,和发音可能混淆的词(如果拼音相同只记录一个就行)。再添加一些其他的乱七八糟的词,这样匹配的时候就不会一直匹配唤醒词了。(唤醒词的重点)
    以小贝为例,则keyword.txt中的内容如下:
    小贝
    小魏
    巧倍
    啊
    呵呵
    哈哈
    么么哒
  2. 在[http://www.speech.cs.cmu.edu/tools/lmtool-new.html] 上面训练上一步的keyword文本。会生成“随机数.lm”和“随机数.dic”,下载这两个文件就可以。用来替代语言模型和拼音字典。
    如:
    1234.lm
    1234.dic
  3. 编辑下载的随机数.dic文件,对照着zh_broadcastnews_utf8.dic的拼音字典,更改成与其同样格式的内容。原字典中不一定会有相同的词语,有的话,就按照原先的写,没有的话,就按照单个发音的写上就可以。
    例如:
    小贝 x i ao b ei
    小魏 x i ao w ei
    巧倍 q i ao b ei
    啊 a as
    .
    .
    .
  4. 在代码中,替换掉对应的lm和dic路径。
import os
from pocketsphinx import LiveSpeech, get_model_path

model_path = get_model_path()

speech = LiveSpeech(
    verbose=False,
    sampling_rate=16000,
    buffer_size=2048,
    no_search=False,
    full_utt=False,
    hmm=os.path.join(model_path, 'zh/zh_broadcastnews_16k_ptm256_8000'),
    lm=os.path.join(model_path, 'zh/1234.lm'),  # 这个目录位置自己设置
    dic=os.path.join(model_path, 'zh/1234.dic')  # 同上
)
for phrase in speech:
    print("phrase:", phrase)
    print(phrase.segments(detailed=True))
    # 只要命中上述关键词的内容,都算对
    if str(phrase) in ["小贝", "小魏", "巧倍"]:
    print("正确识别唤醒词")

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

python语音唤醒-pocketsph

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

python语音唤醒-pocketsph

使用pocketsphinx模块,实现唤醒词功能。运行环境:win10 + Python3.6.2安装模块包:地址:https://pypi.org/project/pocketsphinx/> pip install pocketsphi
2023-01-31

win11小娜怎么设置语音唤醒

本篇内容介绍了“win11小娜怎么设置语音唤醒”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!win11小娜可不可以语音唤醒:答:可以语音唤醒
2023-07-01

python怎么使用send唤醒

这篇文章给大家分享的是有关python怎么使用send唤醒的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。python可以做什么Python是一种编程语言,内置了许多有效的工具,Python几乎无所不能,该语言通俗
2023-06-14

Win10 9926如何语音唤醒Cortana微软小娜向她提问题

泄露的Win10 9901让我们见识了微软小娜的功能,正式发布的Build 9926带来了大家期盼已久的微软小娜。很多用户都迫不及待想使用这个智能助理。Win10 Build 9926如何语音唤醒Cortana微软小娜向她提问题呢?因为现在
2023-06-11

python使用send唤醒的方法

今天小编给大家分享一下python使用send唤醒的方法的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。说明1、除了可以使用n
2023-06-30

小爱同学能唤醒但是没声音怎么解决

小爱同学能唤醒但是没声音解决方法:1、检查电源适配器是否插入到插座并开启,同时确认设备是否正确插入;2、找到设备上的音量调节按钮或者使用语音命令调整音量;3、重新连接或者更换连接方式,并且确保连接正常;4、在设备上,打开小爱同学的应用程序或
2023-07-10

Python Thread虚假唤醒概念与防范代码分析

这篇文章主要介绍“Python Thread虚假唤醒概念与防范代码分析”,在日常操作中,相信很多人在Python Thread虚假唤醒概念与防范代码分析问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Pytho
2023-07-05

Python中如何使用win32api实现自动唤醒并截图

这篇文章主要介绍“Python中如何使用win32api实现自动唤醒并截图”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python中如何使用win32api实现自动唤醒并截图”文章能帮助大家解决问
2023-06-29

python语音朗读

1.安装python2.72.安装pyttsx: pip install pyttsx(需安装pip)github下载地址:https://github.com/westonpace/pyttsx3.安装pywin32(对应python版本
2023-01-31

python语音识别

语音识别技术,也被称为自动语音识别,目标是以电脑自动将人类的语音内容转换为相应的文字。应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。一、功能概述实现将语音转换为文字,调取第3方接口。比如百度ai,图灵机器人,
2023-01-30

Python实现电脑唤醒后自动拍照截屏并发邮件通知

这篇文章主要为大家详细介绍了Python如何实现电脑唤醒后自动拍照截屏并发邮件通知的功能,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
2023-01-10

python 文本转语音播报

第一步:安装pyttsx第三方库windows安装:pip install pyttsx# -*- coding: utf-8-*-import sys  reload(sys)  sys.setdefaultencoding('utf8'
2023-01-31

用Python实现语音播报

以下内容为带着儿子一起学Python的实现记录,为自己保存下来,也希望对其他学习者有用!1. 确保已经安装python,本例使用python,操作系统为:Windows 10 专业版;2. 设置环境变量,设置两个path路径。E:\Pyth
2023-01-31

Python语音交互的实现

实现前提在windows10上运行的测试内容。Python版本:Python3.6.2。已经注册并添加了百度的'’语音识别'和'语音合成'应用。已经注册并创建了图灵机器人的'机器人'。整体的实现流程语音输入。语音翻译成文字。聊天回应文字。将
2023-01-31

Python如何进行语音识别,语音转换功能实现

Python如何进行语音识别,语音转换功能实现,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。相信大家都非常喜欢那些萝莉音,看那些女装大佬,开一个变声器声音实在是很有诱惑力,下面
2023-06-02

怎么用Python脚本实现电脑唤醒后自动拍照并截屏发邮件通知

这篇文章主要介绍“怎么用Python脚本实现电脑唤醒后自动拍照并截屏发邮件通知”,在日常操作中,相信很多人在怎么用Python脚本实现电脑唤醒后自动拍照并截屏发邮件通知问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家
2023-07-05

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录