我的编程空间,编程开发者的网络收藏夹
学习永远不晚

语音识别实战(python代码)(一)

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

语音识别实战(python代码)(一)

 

(python :pyttsx、SAPI、SpeechLib实例代码)(一)

本文目录:

一、语音识别的基本原理

(1)、语音识别的起源与发展

(2)、语音识别的基本原理

(3)、语音识别过程

(4)、语音识别的近期发展

二、Python 语音识别

(1)、文本转换为语音

(2)、文本转存为语音文件wav

三、总结


(1)、语音识别的起源与发展

  语音识别是一门涉及声学、语言学、信号处理、模式识别、心理学,以及计算机科学等多个学科领域的复杂交叉技术学科。

  语音识别技术的发展:

07dc34a8eb9b43af8230fa7d355d4225.jpeg

(2)、语音识别的基本原理

  对普通人来说,我们通常感觉语音是由一个个单词构成,但它是如何产生和被我们感知的?

  其实,语音是一种连续动态的音频流,由一部分相当稳定的状态与诸多动态变化的状态混合而成。在这种状态序列中,人们可以定义或多或少类似的声音或音素。

035b1884f94a4db5ad165ba9186dbc86.png

  语音是随时间变化的语音动态波形。

  一个典型的语音对话系统一般包括如下几个技术模块:

  • 对话管理器(Dialog Manager)
  • 语音识别器(Speech Recognizer)
  • 语言解析器(Language Parser)
  • 语言生成器(Language Generator)
  • 语音合成器(Speech Synthesizer)

4f4ff063788e4cb8a6e46ea61bd1dbc0.png

  其中,语音识别器(又可称为语言识别模块或者语言识别系统)主要用于将用户输入的语音转换为文本。

 (3)、语音识别过程

  语音识别的一般方法是:

  首先,声音输入,提取一个波形,然后,将波形分解为语音片段并尝试识别每个语音片段中所包含的内容。

  通常情况下,要做到这一点,我们需要尝试将所有可能的单词组合与音频进行匹配,最后选择最佳匹配组合,这时就要依赖声音模型、语音模型、各种发音词典。在这个匹配过程中,由于参数的数量很大,需要对其进行优化。一般来说,会将语音分成小单位的帧,然后,对于每帧(通常为时长10ms左右),提取出39个代表语音特征的数字,这些数字即语音特征向量。

  语音识别过程示意图:

60a8a8516dbb45078bc5e50c5e5d3acf.png

  语音识别是一个先编码后解码的过程。其中,信号处理(Signal Processing)与特征提取(Feature Extraction)是语音识别系统的开始,这是一个编码的过程。

  特征提取是指从原始的语音输入经过相应处理后得到语音特征向量。

  语言模型:当若干词组成的一个序列合乎语法时,这个序列才能算是一个句子,因此,人们在语音识别中引入了语言模型来实现这种约束。

  当前的语言模型主要有基于句法的语言模型和基于统计的语言模型两大类。

  句法语言模型(Syntactic Language Model),也称确定性语言模型(Deterministic Language Model)或形式语言模型(Formal Language Model),是人工对人类语言的内在规律总结出一套形式上可以推理和扩展的文法,对识别结果中不符合文法的结果进行排除。这种方法在某些识别任务中能够获得很好的效果。

  基于统计的语言模型对大量文本中的词的出现频率及其出现条件进行统计。通常我们将统计语言模型与声学模型结合起来完成识别任务,这可以降低因为声学模型的不合理带来的拒识率。 目前在大词汇量连续语音识别中常用的是 N-Gram 语言模型[23],对中文而言,我们称之为汉语语言模型(CLM,Chinese Language Model)。

    一个语言模型的质量的评价指标通常用语言模型复杂度(Perplexity)来表述,其定义为词序列概率的几何平均的倒数。公式:

25b9f1e5ef324cb585775f3ea12c72c3.jpeg

   当复杂度越低,说明语言模型对当前词的预测确定程度越高。因此对语言模型的训练一般把训练语句的复杂度最小化作为目标。而实现这个目标,先要对训练语句中的词频进行统计,以此计算出语言模型的参数。而在词表很大而训练的数据不是充分多的时候,就会发生有些词的序列的概率很小或者没有出现过的情况(oov)。为了解决这些问题,就需要用到 discouting和 back-off等一些技术。

  一个语言模型的质量的评价指标通常用语言模型复杂度(Perplexity)来表述,其定义为词序列概率的几何平均的倒数。

(4)、语音识别的近期发展

  据:中国语音产业联盟《中国智能语音产业发展报告(2021-2022)》统计数据:

  从全球范围来看,2022年全球智能语音产业规模将达351.2亿美元,保持33.1%的高速增长;从我国来看,根据德勤统计数据,2022年我国智能语音市场将达341亿元,同比增长13.4%。

  科大讯飞、百度、阿里等龙头企业通过打造技术能力开放平台,构建开源生态,引领行业技术创新和应用开发。

  报告指出,我国智能语音企业在多项难点技术上实现新的突破。纵向上从语音识别、合成、翻译向计算机视觉、认知智能、运动智能领域延伸,横向上从单点技术突破模式发展到机器认知、多模式复杂场景应用。

  在语音合成方面,随着电商直播等行业的繁荣,语音合成技术也表现出拟人化、口语化的发展趋势。

  在语音识别方面,视听融合的多模态交互技术成为技术演进的主要方向。

  在工业领域,我国打造了包括国家智能语音创新中心在内的一批语音技术创新“国家队”, 开展工业声学、多语种、AI语音芯片等关键共性技术研究工作。

  在城市领域,智能语音技术已在安徽省一体化网上政务服务平台、聊城城市大脑、三亚市崖州湾科技城智慧产城园区、天津市AI银发智能服务平台等创新示范项目中应用。

  在医疗领域,智能外呼和智医助理可用于独居老人、留守儿童的日常关爱和兜底保障。

  在教育领域,利用智能语音和人工智能技术可实现英语听说教、学、考、评、管一站式服务,减少无效训练。

  在运营商领域,智能语音技术与健康养老、家庭教育、家庭娱乐等场景结合,带来更加智慧的家庭生活体验。融合5G与机器翻译技术的无障碍智能通信,让普通的5G手机用户,不用下载任何软件,就可以使用实时翻译和转写服务,实现跨语种的无障碍视频通话。

  在汽车领域,智能语音已成人机交互关键环节,并从车内交互衍生车外交互,从单模交互走向多模交互,从被动交互发展为主动交互,为车企提供全栈技术赋能。

  在消费者产品领域,AI学习机、翻译笔等AI+学习产品帮助学生学习减负增效;智能录音笔、智能办公本、智能鼠标等AI+办公产品深受职场人士欢迎;AI翻译机、智能麦克风、智能语音键盘、智能耳机、智能助听器等AI+生活产品,让更多人享受AI科技的便利。

  语音的发展路径:

  针对智能语音多学科交叉的学科特性,研究人员需要探索新原理、新机制、新材料、新工艺和新器件,集成创新推动核心技术进步。另一方面,语音技术需要进一步向深度理解延伸。“更先进的语音交互系统不仅要 "能听会说" ,还要深度地去理解人的信息。有了明确的发展方向,才能促进智能语音技术持续突破。

(1)、文本转换为语音

(a)、使用 pyttsx

安装 pyttsx 包

  • import pyttsx3 as pyttsx
import pyttsx3 as pyttsxengine = pyttsx.init()engine.say('I can because i think i can. 逆境清醒 Life is not all roses.人生并不是康庄大道。')engine.runAndWait()

  如果你安装没有出错,打开电脑的声音,就能听到语音(把我们刚才在代码里写的文本文字转换成语音播报出来了)

代码分析:

pyttsx3通过初始化来获取语音引擎,在调用init后会返回一个engine对象。

import pyttsx3

#初始化语音引擎
engine = pyttsx3.init()

设置语速、音量等参数:

engine.setProperty('rate', 100)   #设置语速
engine.setProperty('volume',0.6)  #设置音量

查看语速、音量等参数

rate = engine.getProperty('rate')
print(f'语速:{rate}')
volume = engine.getProperty('volume')   
print (f'音量:{volume}') 

 完整实例代码:

import pyttsx3 as pyttsxengine = pyttsx.init()engine.say('I can because i think i can. 逆境清醒 Life is not all roses.人生并不是康庄大道。')rate = engine.getProperty('rate')print(f'语速:{rate}')volume = engine.getProperty('volume')   print (f'音量:{volume}') engine.runAndWait()

运行结果为:

查看语音合成器
voices = engine.getProperty('voices') 
for voice in voices:
    print(voice) 

合成器的主要参数如下:

合成器的主要参数如下:
age发音人的年龄默认为None
gender以字符串为类型的发音人性别

male, female, or neutral.

默认为None

id关于Voice的字符串确认信息
languages发音支持的语言列表默认为一个空的列表
name发音人名称默认为None
语音合成器

默认的有两个

两个语音合成器均可以合成英文音频,

只有第一个合成器能合成中文音频。

如果需要其他的语音合成器需要自行下载和设置。

#设置第一个语音合成器
voices = engine.getProperty('voices') 
engine.setProperty('voice',voices[0].id)   

语音播报:

engine.say('I can because i think i can. 逆境清醒 Life is not all roses.人生并不是康庄大道。')
engine.runAndWait()
engine.stop()

import pyttsx3engine = pyttsx3.init() #初始化语音引擎engine.say('I can because i think i can. 逆境清醒 Life is not all roses.人生并不是康庄大道。')rate = engine.getProperty('rate')print(f'语速:{rate}')volume = engine.getProperty('volume')   print (f'音量:{volume}') engine.setProperty('rate', 100)   #设置语速engine.setProperty('volume',0.6)  #设置音量voices = engine.getProperty('voices') engine.setProperty('voice',voices[0].id)   #设置第一个语音合成器engine.runAndWait()engine.stop()

运行结果为:

  如果你没有出错,打开电脑的声音,就能听到语音(把我们刚才在代码里写的文本文字转换成语音播报出来了:I can because i think i can. 逆境清醒 Life is not all roses.人生并不是康庄大道。)

  我们设置使用第一个语音合成器,同时,屏幕会打印出当前语速是200,音量是:1.0

(b)、使用 SAPI

  也可以使用 SAPI 来做文本到语音的转换。

   SAPI是微软Speech API , 是微软公司推出的语音接口。

from win32com.client import Dispatch# 获取讲话对象speaker = Dispatch('SAPI.SpVoice')# 讲话内容speaker.Speak('Just Be You')speaker.Speak('No one can do it just like you')speaker.Speak('Something magic in the way you move')speaker.Speak('You are original, you know it is true')speaker.Speak('do not let anybody take your tune')speaker.Speak('You are not got a single thing to prove')speaker.Speak('You are original, so just be you')speaker.Speak('Just be you')speaker.Speak('You are one of a kind')speaker.Speak('The kind of once in a lifetime')speaker.Speak('Not just another face in the crowd')speaker.Speak('You light up a room')speaker.Speak('With the light that is inside you')speaker.Speak('do not be afraid to let it out')speaker.Speak('So hold your head up')speaker.Speak('do not let anybody get you down')speaker.Speak('No one can do it just like you')speaker.Speak('Something magic in the way you move')speaker.Speak('You are original, you know it is true')speaker.Speak('do not let anybody take your tune')speaker.Speak('You are not got a single thing to prove')speaker.Speak('You are original, so just be you')speaker.Speak('Just be you')speaker.Speak('Ooh, just be you')speaker.Speak('Ooh, just be you')speaker.Speak('You gotta believe')speaker.Speak('You are here for a reason')speaker.Speak('This world needs somebody like you')speaker.Speak('Cause anybody can be a copy')speaker.Speak('And there will always be people talking')speaker.Speak('So face your fears and chase your dreams')speaker.Speak('And dance like no one is watching')speaker.Speak('No one can do it just like you')speaker.Speak('Something magic in the way you move')speaker.Speak('You are original, you know it is true')speaker.Speak('do not let anybody take your tune')speaker.Speak('You are not got a single thing to prove')speaker.Speak('You are original, so just be you')speaker.Speak('Just be you')speaker.Speak('Ooh, just be you')speaker.Speak('Ooh, just be you')speaker.Speak('You are one of a kind')speaker.Speak('The kind of once in a lifetime')speaker.Speak('Not just another face in the crowd')speaker.Speak('No one can do it just like you')speaker.Speak('Something magic in the way you move')speaker.Speak('You are original, you know it is true')speaker.Speak('do not let anybody take your tune')speaker.Speak('You are not got a single thing to prove')speaker.Speak('You are original, so just be you')speaker.Speak('Just be you')speaker.Speak('Ooh, just be you')speaker.Speak('Ooh, just be you')speaker.Speak('没有人能像你一样')speaker.Speak('那样的充满魔力')speaker.Speak('你知道的,你是最初的你')speaker.Speak('不要让任何人改变你')speaker.Speak('你不需要去证明什么')speaker.Speak('你是最初的你,做你自己')speaker.Speak('做你自己吧')speaker.Speak('你是独一无二的')speaker.Speak('一生仅有一个的那种')speaker.Speak('你不像人群中的另一种面孔')speaker.Speak('你用你内心的温暖')speaker.Speak('照亮了整个房间')speaker.Speak('不要害怕说出来')speaker.Speak('抬起你的头吧')speaker.Speak('不要因为任何人而让你失望')speaker.Speak('没有人能像你一样')speaker.Speak('那样的充满魔力')speaker.Speak('你知道的,你还是最初的你')speaker.Speak('不要让任何人改变你')speaker.Speak('你不用去证明什么')speaker.Speak('因为你就是你')speaker.Speak('做你自己')speaker.Speak('Ooh, just be you')speaker.Speak('做你自己吧')speaker.Speak('Ooh, just be you')speaker.Speak('做你自己')speaker.Speak('你必须要相信')speaker.Speak('你来这一趟是有原因的')speaker.Speak('这个世界需要像你一样的人存在')speaker.Speak('因为任何人都可是一个复制品')speaker.Speak('人们总是在背后指指点点')speaker.Speak('战胜内心的恐惧,去追逐你的梦想')speaker.Speak('假装没有人在看你,自在地舞动吧')speaker.Speak('没有人能像你一样')speaker.Speak('那样的充满魔力')speaker.Speak('你知道的,你还是最初的你')speaker.Speak('不要因为任何人而改变你自己')speaker.Speak('你也不用去证明什么')speaker.Speak('你就是最初的你')speaker.Speak('做你自己')speaker.Speak('做你自己吧')speaker.Speak('做你自己')speaker.Speak('你是独一无二的')speaker.Speak('一生仅有一个的那种')speaker.Speak('不像人群中的另一种面孔')speaker.Speak('没有人像你')speaker.Speak('如此有魔力')speaker.Speak('你也知道的,你还是原本的你')speaker.Speak('不要让任何人改变你')speaker.Speak('你不需要去证明什么')speaker.Speak('你还是原来的你')speaker.Speak('做你自己')speaker.Speak('做你自己吧')speaker.Speak('Ooh, just be you')speaker.Speak('做你自己吧')# 释放对象del speaker

  如果你没有出错,打开电脑的声音,就能听到语音(把我们刚才在代码里写的文本文字转换成语音播报出来了)

(2)、文本转存为语音文件wav

(a)、用SpeechLib库

方法:1.从文本文件中获取输入语音的文本内容,将其转换为语音,保存成.wav格式

使用 SpeechLib,需要先安装, 命令如下:

  • pip install comtypes
from comtypes.client import CreateObjectengine = CreateObject('SAPI.SpVoice')stream = CreateObject('SAPI.SpFileStream')from comtypes.gen import SpeechLibinfile = '就算世界无童话.txt'outfile = '就算世界无童话.wav'stream.open(outfile, SpeechLib.SSFMCreateForWrite)engine.AudioOutputStream = streamf = open(infile, 'r', encoding='utf-8')theText = f.read()f.close()stream.close()

  如果你没有出错,电脑里同一个目录里出现了转换好的语音文件“ 就算世界无童话.wav ”

  本文主要从概念上图文论述了语音识别的起源与发展、语音识别的基本原理、语音识别过程、语音识别的近期发展。

  代码上分析了Python 语音识别所用到的技术,从 (1)、文本转换为语音。(2)、文本转存为语音文件wav。两个方面实例操作了语音识别的技术实现方式,并提供了完整源代码供参考。

  python语音识别还有其他的方法,例如从话筒等输入语音来识别,这些将会在后面更新博文时再详细分析。

          推荐阅读:

计算机视觉__基本图像操作(显示、读取、保存)直方图(颜色直方图、灰度直方图)直方图均衡化(调节图像亮度、对比度)

 语音识别实战(python代码)(一)

 人工智能基础篇

 计算机视觉基础__图像特征

93d65dbd09604c4a8ed2c01df0eebc38.png

 matplotlib 自带绘图样式效果展示速查(28种,全)

074cd3c255224c5aa21ff18fdc25053c.png

Three.js实例详解___旋转的精灵女孩(附完整代码和资源)(一)

fe88b78e78694570bf2d850ce83b1f69.png

cb4b0d4015404390a7b673a2984d676a.png

立体多层玫瑰绘图源码__玫瑰花python 绘图源码集锦

 Python 3D可视化(一)

 让你的作品更出色——词云Word Cloud的制作方法(基于python,WordCloud,stylecloud)

e84d6708316941d49a79ddd4f7fe5b27.png

938bc5a8bb454a41bfe0d4185da845dc.jpeg

0a4256d5e96d4624bdca36433237080b.png

 python Format()函数的用法___实例详解(一)(全,例多)___各种格式化替换,format对齐打印

 用代码写出浪漫__合集(python、matplotlib、Matlab、java绘制爱心、玫瑰花、前端特效玫瑰、爱心)

python爱心源代码集锦(18款)

dc8796ddccbf4aec98ac5d3e09001348.jpeg

0f09e73712d149ff90f0048a096596c6.png

40e8b4631e2b486bab2a4ebb5bc9f410.png

 Python中Print()函数的用法___实例详解(全,例多)

 Python函数方法实例详解全集(更新中...)

 《 Python List 列表全实例详解系列(一)》__系列总目录、列表概念

09e08f86f127431cbfdfe395aa2f8bc9.png

用代码过中秋,python海龟月饼你要不要尝一口?

 python练习题目录

03ed644f9b1d411ba41c59e0a5bdcc61.png

daecd7067e7c45abb875fc7a1a469f23.png

17b403c4307c4141b8544d02f95ea06c.png

草莓熊python turtle绘图(风车版)附源代码

 ​草莓熊python turtle绘图代码(玫瑰花版)附源代码

 ​草莓熊python绘图(春节版,圣诞倒数雪花版)附源代码

4d9032c9cdf54f5f9193e45e4532898c.png

c5feeb25880d49c085b808bf4e041c86.png

 巴斯光年python turtle绘图__附源代码

皮卡丘python turtle海龟绘图(电力球版)附源代码

vue3 项目搭建教程(基于create-vue,vite,Vite + Vue)

fea225cb9ec14b60b2d1b797dd8278a2.png

bba02a1c4617422c9fbccbf5325850d9.png

37d6aa3e03e241fa8db72ccdfb8f716b.png

2023年春节祝福第二弹——送你一只守护兔,让它温暖每一个你【html5 css3】画会动的小兔子,炫酷充电,字体特

 别具一格,原创唯美浪漫情人节表白专辑,(复制就可用)(html5,css3,svg)表白爱心代码(4套)

SVG实例详解系列(一)(svg概述、位图和矢量图区别(图解)、SVG应用实例)

5d409c8f397a45c986ca2af7b7e725c9.png

6176c4061c72430eb100750af6fc4d0e.png

1f53fb9c6e8b4482813326affe6a82ff.png

【程序人生】卡塔尔世界杯元素python海龟绘图(附源代码),世界杯主题前端特效5个(附源码)HTML+CSS+svg绘制精美彩色闪灯圣诞树,HTML+CSS+Js实时新年时间倒数倒计时(附源代码)

 2023春节祝福系列第一弹(上)(放飞祈福孔明灯,祝福大家身体健康)(附完整源代码及资源免费下载)

80007dbf51944725bf9cf4cfc75c5a13.png

1ab685d264ed4ae5b510dc7fbd0d1e55.jpeg

1750390dd9da4b39938a23ab447c6fb6.jpeg

 Node.js (v19.1.0npm 8.19.3) vue.js安装配置教程(超详细)

 色彩颜色对照表(一)(16进制、RGB、CMYK、HSV、中英文名)

2023年4月多家权威机构____编程语言排行榜__薪酬状况

aa17177aec9b4e5eb19b5d9675302de8.png

38266b5036414624875447abd5311e4d.png

6824ba7870344be68efb5c5f4e1dbbcf.png

 手机屏幕坏了____怎么把里面的资料导出(18种方法)

【CSDN云IDE】个人使用体验和建议(含超详细操作教程)(python、webGL方向)

 查看jdk安装路径,在windows上实现多个java jdk的共存解决办法,安装java19后终端乱码的解决

fffa2098008b4dc68c00a172f67c538d.png

5218ac5338014f389c21bdf1bfa1c599.png

c6374d75c29942f2aa577ce9c5c2e12b.png

 tomcat11、tomcat10 安装配置(Windows环境)(详细图文)

 Tomcat端口配置(详细)

 Tomcat 启动闪退问题解决集(八大类详细)

来源地址:https://blog.csdn.net/weixin_69553582/article/details/129943496

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

语音识别实战(python代码)(一)

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Android实现语音识别代码

苹果的iphone 有语音识别用的是Google 的技术,做为Google 力推的Android 自然会将其核心技术往Android 系统里面植入,并结合google 的云端技术将其发扬光大。 所以Google Voice Recognit
2022-06-06

Android语音识别技术详解及实例代码

今天从网上找了个例子实现了语音识别,个人感觉挺好玩的,就把代码贴出来与大家分享下: Android中主要通过RecognizerIntent来实现语音识别,其实代码比较简单,但是如果找不到设置,就会抛出异常Activ
2022-06-06

Android 轻松实现语音识别详解及实例代码

使用Intent调用语音识别程序 说明 Android中主要通过RecognizerIntent来实现语音识别,其实代码比较简单,但是如果找不到语音识别设备,就会抛出异常 ActivityNotFoundException,所以我们需要捕捉
2022-06-06

Python中怎么实现语音识别

今天就跟大家聊聊有关Python中怎么实现语音识别,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。离线转换对于国内的网络环境,无法用google API来将语音数据转换成文本文件,因为
2023-06-16

Android使用百度语音识别的示例代码

本文使用百度语音识别,完成语音识别的功能,使用百度语音识别,先要申请APP ID,这个直接到百度网站上有说明文档,本文不再赘述。申请之后,下载SDK包,按照百度官网要求,合并libs和res两个目录到项目中,然后在build.gradle(
2022-06-06

Python如何进行语音识别,语音转换功能实现

Python如何进行语音识别,语音转换功能实现,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。相信大家都非常喜欢那些萝莉音,看那些女装大佬,开一个变声器声音实在是很有诱惑力,下面
2023-06-02

Python实战之手势识别控制电脑音量

这篇文章主要为大家详细介绍了一个PythonOpenCV的实战小项目——手势识别控制电脑音量,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
2023-05-18

python实现人脸识别代码

从实时视频流中识别出人脸区域,从原理上看,其依然属于机器学习的领域之一,本质上与谷歌利用深度学习识别出猫没有什么区别。程序通过大量的人脸图片数据进行训练,利用数学算法建立建立可靠的人脸特征模型,如此即可识别出人脸。幸运的是,这些工作Open
2022-06-04

这一篇就够了 python语音识别指南终

【导读】亚马逊的 Alexa 的巨大成功已经证明:在不远的将来,实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是,在 Python 程序中实现语音识别
2023-01-31

Linux下怎么用python实现语音识别功能

这篇文章主要介绍“Linux下怎么用python实现语音识别功能”,在日常操作中,相信很多人在Linux下怎么用python实现语音识别功能问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Linux下怎么用py
2023-07-05

Python调用百度api怎么实现语音识别

Python调用百度api怎么实现语音识别,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。最近在学习python,做一些python练习题github上几年前的练习题有一题是这样
2023-06-21

怎么用Python一行代码识别车牌号码

这篇“怎么用Python一行代码识别车牌号码”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“怎么用Python一行代码识别车牌
2023-07-05

Linux下利用python实现语音识别详细教程

目录语音识别工作原理简介选择合适的python语音识别包安装SpeechRecognition识别器类音频文件的使用英文的语音识别噪音对语音识别的影响麦克风的使用中文的语音识别小范围中文识别语音合成语音识别工作原理简介 语音识别源于 20
2023-03-31

怎么用Python代码实现人脸识别

这篇文章主要介绍“怎么用Python代码实现人脸识别”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“怎么用Python代码实现人脸识别”文章能帮助大家解决问题。正文:环境要求:Ubuntu17.10P
2023-06-29

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录