位置：首页-资讯-后端开发

Python人工智能语音合成实现案例详解

2023-03-21 18:00

短信预约 -IT技能 免费直播动态提醒

正文

今天给大家介绍一下基于百度的AI语音技术SDK实现语音合成的案例，编程语言采用Python，希望对大家能有所帮助！

一、注册百度AI平台应用

ai.baidu.com/

首先登陆自己的百度账户，打开百度的AI开发平台页面

搜索找到离线语音合成，然后点击立即使用，进入百度智能云页面。

创建应用选择语音技术，默认为全部勾选

创建后可以在应用列表可以看到刚刚创建的语音应用。

主要信息是AppID、API Key、Secret Key 这个是自己专属应用的应用id和密钥后面的python代码需要进行配置。

二、编写Python代码

推荐使用pycharm进行代码编写，方便调试和代码格式的检查、以及依赖包导入。

打开pycharm安装依赖包

安装百度语音合成Python依赖

pip install baidu-aip

新建一个speech.py 文件，内容如下：

具体的参数可以参考最新的SDK文档，下面注释写的也比较详细，大家可以看下，应该都可以理解的。

from aip import AipSpeech
# 应用ID
APP_ID = 'xxxxxxx'
# 应用密钥
API_KEY = 'xxxxxxxxxx'
# 安全密钥
SECRET_KEY = 'xxxxxxxxxxxxxxxxxxx'
# 创建语音识别客户端
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
# 设置语音文本 也可以从本地文件读取
Text = '这里是IT技术分享社区，一个有态度的互联网技术交流社区，期待您的加入！'
# 设置合成语音的存储路径
filePath = 'D:\test.mp3'
# 调用客户端方法进行语音生成
result = client.synthesis(Text, 'zh', 1, {
    'vol': 6,  # 合成音频文件的准音量
    'pit': 8,  # 设置语音的音调 取值为0~9 默认为5
    'per': 0,  # 发音人类型 0 女生 1 男生 3 情感合成-度逍遥 4 情感合成-度丫丫，默认为 0 女生，具体的参考官方文档介绍
})
# 判断是否调用成功
if not isinstance(result, dict):
    # 如果调用的成功的话 保存合成的语音文件
    with open(filePath, 'wb') as f:
        f.write(result)

然后运行speech.py 文件，可能会报ModuleNotFoundError: No module named 'chardet' 错误

处理办法是安装编码