我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Android学习之语音识别、语音合成

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Android学习之语音识别、语音合成

SDK

SDK (Software Development Kit) 软件开发工具包是软件开发工程师用于为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件的开发工具的集合。Android SDK就 Android专属的软件开发工具包。

录音权限申请
	//申请录音权限
    private static final int GET_RECODE_AUDIO = 1;
    private static String[] PERMISSION_AUDIO = {
            Manifest.permission.RECORD_AUDIO
    };
    
    public static void verifyAudioPermissions(Activity activity) {
        int permission = ActivityCompat.checkSelfPermission(activity,
                Manifest.permission.RECORD_AUDIO);
        if (permission != PackageManager.PERMISSION_GRANTED) {
            ActivityCompat.requestPermissions(activity, PERMISSION_AUDIO,
                    GET_RECODE_AUDIO);
        }
    }
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_main);
        verifyAudioPermissions(this);//申请录音权限
	}
讯飞SDK

讯飞开放平台

注册账号,下载demo,并将相应jar包和资源导入自己项目
语音配置对象初始化
SpeechUtility.createUtility(this, SpeechConstant.APPID + "=申请的APPID");
语音识别
//存放听写分析结果文本
private HashMap hashMapTexts = new LinkedHashMap();
private void listen() {
    // 1.创建SpeechRecognizer对象,第2个参数:本地听写时传InitListener
    //听写对象
    SpeechRecognizer hearer = SpeechRecognizer.createRecognizer(getActivity(), null);
    // 交互动画
    //讯飞提示框
    RecognizerDialog dialog = new RecognizerDialog(getActivity(), null);
    // 2.设置听写参数,详见《科大讯飞MSC API手册(Android)》SpeechConstant类
    //设置语法ID和 SUBJECT 为空,以免因之前有语法调用而设置了此参数;或直接清空所有参数,具体可参考 DEMO 的示例。
    hearer.setParameter( SpeechConstant.CLOUD_GRAMMAR, null );
    hearer.setParameter( SpeechConstant.SUBJECT, null );
    // domain:域名
    hearer.setParameter(SpeechConstant.DOMAIN, "iat");
    //设置语音输入语言,zh_cn为简体中文 mandarin:普通话
    hearer.setParameter(SpeechConstant.LANGUAGE, "zh_cn");
    hearer.setParameter(SpeechConstant.ACCENT, "mandarin");
    // 设置语音前端点:静音超时时间,单位ms,即用户多长时间不说话则当做超时处理
    //取值范围{1000~10000}
    hearer.setParameter(SpeechConstant.VAD_BOS, "4000");
    //设置语音后端点:后端点静音检测时间,单位ms,即用户停止说话多长时间内即认为不再输入,
    //自动停止录音,范围{0~10000}
    hearer.setParameter(SpeechConstant.VAD_EOS, "2000");
    //设置是否显示标点0表示不显示,1表示显示
    hearer.setParameter(SpeechConstant.ASR_PTT,"1");
    //3.开始听写
    dialog.setListener(new RecognizerDialogListener() {  //设置对话框
        @Override
        public void onResult(RecognizerResult results, boolean isLast) {
            // TODO 自动生成的方法存根
            Log.d("Result", results.getResultString());
            //(1) 解析 json 数据<>
            StringBuffer strBuffer = new StringBuffer();
            try {
                JSONTokener tokener = new JSONTokener(results.getResultString());
                Log.i("TAG", "Test"+results.getResultString());
                Log.i("TAG", "Test"+results.toString());
                JSONObject joResult = new JSONObject(tokener);
                JSONArray words = joResult.getJSONArray("ws");
                for (int i = 0; i < words.length(); i++) {
                    // 转写结果词,默认使用第一个结果
                    JSONArray items = words.getJSONObject(i).getJSONArray("cw");
                    JSONObject obj = items.getJSONObject(0);
                    strBuffer.append(obj.getString("w"));
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
            // (2)读取json结果中的sn字段
            String sn = null;
            try {
                JSONObject resultJson = new JSONObject(results.getResultString());
                sn = resultJson.optString("sn");
            } catch (JSONException e) {
                e.printStackTrace();
            }
            //(3) 解析语音文本<>
            hashMapTexts.put(sn, strBuffer.toString());
            StringBuffer resultBuffer = new StringBuffer();  //最后结果
            for (String key : hashMapTexts.keySet()) {
                resultBuffer.append(hashMapTexts.get(key));
            }
            //显示识别得到的文字
            et_value.setText(resultBuffer.toString());
            et_value.requestFocus();//获取焦点
            et_value.setSelection(resultBuffer.toString().length());//将光标定位到文字最后,以便修改
        }
        @Override
        public void onError(SpeechError error) {
            // TODO 自动生成的方法存根
            error.getPlainDescription(true);
        }
    });
    dialog.show();  //显示对话框
}
语音合成(封装)
public class SpeechCompound {
    // Log标签
    private static final String TAG = "SpeechCompound";
    // 上下文
    private Context mContext;
    // 语音合成对象
    private static SpeechSynthesizer mTts;
    
    public final static String[] COLOUD_VOICERS_VALUE = {"aisjiuxu", "xiaoyu", "catherine", "henry", "vimary", "vixy", "xiaoqi", "vixf", "xiaomei",
            "xiaolin", "xiaorong", "xiaoqian", "xiaokun", "xiaoqiang", "vixying", "xiaoxin", "nannan", "vils",};
    
    public SpeechCompound(Context context) {
        Log.d("tag54", "初始化失败,错ss 误码:" );
        // 上下文
        mContext = context;
        // 初始化合成对象
        mTts = SpeechSynthesizer.createSynthesizer(mContext, new InitListener() {
            @Override
            public void onInit(int code) {
                if (code != ErrorCode.SUCCESS) {
                    Log.d("tag54", "初始化失败,错误码:" + code);
                }
                Log.d("tag54", "初始化失败,q错误码:" + code);
            }
        });
    }
    
    public void speaking(String text) {
        // 非空判断
        if (TextUtils.isEmpty(text)) {
            return;
        }
        int code = mTts.startSpeaking(text, mTtsListener);
        Log.d("tag54","-----"+code+"++++++++++");
        if (code != ErrorCode.SUCCESS) {
            if (code == ErrorCode.ERROR_COMPONENT_NOT_INSTALLED) {
                Toast.makeText(mContext, "没有安装语音+ code = " + code, Toast.LENGTH_SHORT).show();
            } else {
                Toast.makeText(mContext, "语音合成失败,错误码: " + code, Toast.LENGTH_SHORT).show();
            }
        }
    }
    
    public static void stopSpeaking() {
        // 对象非空并且正在说话
        if (null != mTts && mTts.isSpeaking()) {
            // 停止说话
            mTts.stopSpeaking();
        }
    }
    
    public static boolean isSpeaking() {
        if (null != mTts) {
            return mTts.isSpeaking();
        } else {
            return false;
        }
    }
    
    private SynthesizerListener mTtsListener = new SynthesizerListener() {
        @Override
        public void onSpeakBegin() {
            Log.i(TAG, "开始播放");
        }
        @Override
        public void onSpeakPaused() {
            Log.i(TAG, "暂停播放");
        }
        @Override
        public void onSpeakResumed() {
            Log.i(TAG, "继续播放");
        }
        @Override
        public void onBufferProgress(int percent, int beginPos, int endPos, String info) {
            // TODO 缓冲的进度
            Log.i(TAG, "缓冲 : " + percent);
        }
        @Override
        public void onSpeakProgress(int percent, int beginPos, int endPos) {
            // TODO 说话的进度
            Log.i(TAG, "合成 : " + percent);
        }
        @Override
        public void onCompleted(SpeechError error) {
            if (error == null) {
                Log.i(TAG, "播放完成");
            } else if (error != null) {
                Log.i(TAG, error.getPlainDescription(true));
            }
        }
        @Override
        public void onEvent(int eventType, int arg1, int arg2, Bundle obj) {
        }
    };
    
    private void setParam() {
        // 清空参数
        mTts.setParameter(SpeechConstant.PARAMS, null);
        // 引擎类型 网络
        mTts.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_CLOUD);
        // 设置发音人
        mTts.setParameter(SpeechConstant.VOICE_NAME, COLOUD_VOICERS_VALUE[0]);
        // 设置语速
        mTts.setParameter(SpeechConstant.SPEED, "50");
        // 设置音调
        mTts.setParameter(SpeechConstant.PITCH, "50");
        // 设置音量
        mTts.setParameter(SpeechConstant.VOLUME, "100");
        // 设置播放器音频流类型
        mTts.setParameter(SpeechConstant.STREAM_TYPE, "3");
        // mTts.setParameter(SpeechConstant.TTS_AUDIO_PATH, Environment.getExternalStorageDirectory() + "/KRobot/wavaudio.pcm");
        // 背景音乐  1有 0 无
        // mTts.setParameter("bgs", "1");
    }
}
语音合成(调用)
public class MainActivity extends AppCompatActivity {
    private EditText edt;
    private Button btn;
    private SpeechCompound speechCompound;
    @Override
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_main);
        edt= findViewById(R.id.et_text);
        btn= findViewById(R.id.btn);
        speechCompound=new SpeechCompound(this);
        btn.setOnClickListener(new View.OnClickListener() {
            @Override
            public void onClick(View v) {
                speechCompound.speaking(edt.getText().toString().trim());
            }
        });
    }
}
问题

讯飞语音合成,中文还算可以,但英文句子效果很差,纯英文的发音人需要付费,故考虑百度语音合成,百度语音合成虽然免费,但语音识别是收费的,最后考虑Android调用自带TTS文本转语音引擎实现离线语音合成,缺点是音质较差等。
百度AI平台

Android自带TTS(封装)

TextToSpeech


public class SpeechUtils {
    private Context mcontext;
    private static final String TAG = "SpeechUtils";
    private static TextToSpeech textToSpeech; // TTS对象
    public SpeechUtils(Context context) {
        mcontext = context;
        textToSpeech = new TextToSpeech(mcontext, new TextToSpeech.OnInitListener() {
            @Override
            public void onInit(int i) {
                if (i == TextToSpeech.SUCCESS) {
                    //textToSpeech.setLanguage(Locale.US);
                    //textToSpeech.setPitch(1.0f);// 设置音调,值越大声音越尖(女生),值越小则变成男声,1.0是常规
                    //textToSpeech.setSpeechRate(0.8f);
                    textToSpeech.speak("", TextToSpeech.QUEUE_FLUSH, null);
                }
            }
        });
    }
    //语音合成
    public void speakText(String text) {
        if (textToSpeech != null) {
            textToSpeech.speak(text,
                    TextToSpeech.QUEUE_FLUSH, null);
        }
    }
   //停止但不关闭
    public void stopSpeaking() {
        // 对象非空并且正在说话
        if (null != textToSpeech && textToSpeech.isSpeaking()) {
            // 停止说话
            textToSpeech.stop();
        }
    }
    //停止并关闭
    public void shutdownSpeaking() {
        // 对象非空并且正在说话
        if (null != textToSpeech && textToSpeech.isSpeaking()) {
            // 停止说话
            textToSpeech.stop();
            textToSpeech.shutdown(); // 关闭,释放资源
        }
    }
}

调用与上述类似。

另外,语言、音高、语速可以在代码中设置,也可以在手机中

设置>辅助功能>无障碍>文字转语音(TTS)输出
设置

注意:部分手机自带讯飞的语音合成(如荣耀),好像就只能调用讯飞的。


作者:Leslie_Waong


免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Android学习之语音识别、语音合成

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Android学习之语音识别、语音合成

SDK SDK (Software Development Kit) 软件开发工具包是软件开发工程师用于为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件的开发工具的集合。Android SDK就 Android专属的软件开发工具包
2022-06-06

Python学习案例之Web版语音合成播

前言语音合成技术能将用户输入的文字,转换成流畅自然的语音输出,并且可以支持语速、音调、音量设置,打破传统文字式人机交互的方式,让人机沟通更自然。应用场景将游戏场景中的公告、任务或派单信息通过语音播报,让玩家玩游戏或配送员送货的同时,也可接听
2023-01-30

Android基于讯飞语音SDK实现语音识别

一、准备工作 1、你需要android手机应用开发基础 2、科大讯飞语音识别SDK android版 3、科大讯飞语音识别开发API文档 4、android手机 关于科大讯飞SDK及API文档,请到科大语音官网下载:http://www.x
2022-06-06

Android编程之语音识别实现方法

本文实例讲述了Android编程之语音识别实现方法。分享给大家供大家参考,具体如下: 语音识别技术在手机上应用得相当广泛,人类日常最频繁的沟通方式是语音,而在手机应用中,大部分是通过硬件手动输入,目前这依然是主要与手机互动的方式。但是随着手
2022-06-06

C#英文语音合成与中文语音识别技术举例分析

这篇文章主要讲解了“C#英文语音合成与中文语音识别技术举例分析”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“C#英文语音合成与中文语音识别技术举例分析”吧!C#英文语音合成与中文语音识别技术
2023-06-17

Android实现语音识别代码

苹果的iphone 有语音识别用的是Google 的技术,做为Google 力推的Android 自然会将其核心技术往Android 系统里面植入,并结合google 的云端技术将其发扬光大。 所以Google Voice Recognit
2022-06-06

鸿蒙AI能力之语音识别

文章旨在帮助大家开发录音及语音识别时少踩一点坑。AI语音识别不需要任何权限,但此处使用到麦克风录制音频,就需要申请麦克风权限。

轻松实现Android语音识别功能

苹果的iphone有语音识别用的是Google的技术,做为Google力推的Android 自然会将其核心技术往Android 系统里面植入,并结合google 的云端技术将其发扬光大。 所以Google Voice Recognition
2022-06-06

android语音识别功能怎么实现

要实现Android平台的语音识别功能,可以使用Android提供的语音识别API,具体步骤如下:在AndroidManifest.xml文件中添加必要的权限:在布局文件中添加一个按钮来触发语音识别:在Activity中初始化语音识别引擎,
2023-10-22

微信小程序语音识别与合成怎么实现

这篇文章主要介绍了微信小程序语音识别与合成怎么实现 的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇微信小程序语音识别与合成怎么实现 文章都会有所收获,下面我们一起来看看吧。先叙述下原理:利用微信小程序api,录
2023-06-26

语音识别的发展之路要怎么走

目前,语音交互赛道已汇集了互联网巨头、知名硬件企业、电商平台、传统家电厂商以及各类人工智能初创公司,特别是近几年以智能音箱为代表的语音交互产品在国内外的火爆,极大地激发了语音交互技术的应用和发展。
语音识别2024-12-01

Android语音识别技术详解及实例代码

今天从网上找了个例子实现了语音识别,个人感觉挺好玩的,就把代码贴出来与大家分享下: Android中主要通过RecognizerIntent来实现语音识别,其实代码比较简单,但是如果找不到设置,就会抛出异常Activ
2022-06-06

百度语音识别(Baidu Voice) Android studio版本详解

百度语音识别(Baidu Voice) Android studio版本 已同步更新至个人blog:http://dxjia.cn/2016/02/29/baidu-voice-helper/ 最近在一个练手小项目里要
2022-06-06

用活人脑细胞造AI系统!语音识别已成功,可无监督学习

这个特别的AI系统甚至可以进行无监督学习:研究人员只是一遍遍播放音频片段,不提供任何形式的反馈来告诉系统答对还是错。最终,该系统在两天的训练之后,准确率直接从最初的51%升到了78%。
AI数据2024-11-30

怎么Android项目中使用百度语音识别

这篇文章将为大家详细讲解有关怎么Android项目中使用百度语音识别,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。使用百度语音识别,先要申请APP ID,这个直接到百度网站上有说明文档,本文
2023-05-31

Android使用百度语音识别的示例代码

本文使用百度语音识别,完成语音识别的功能,使用百度语音识别,先要申请APP ID,这个直接到百度网站上有说明文档,本文不再赘述。申请之后,下载SDK包,按照百度官网要求,合并libs和res两个目录到项目中,然后在build.gradle(
2022-06-06

Android实现云知声版离线语音合成

目录简介在线合成和离线合成(合成速度)集成方法在AndroidManifest.xml设置所需要的权限使用方法总结简介 科大讯飞:合成速度快,准确度高,模型多。但问题也是相当明显,只有在线合成是免费的,离线则是一笔不小的开销。 百度:是专门
2022-06-07

编程热搜

  • Android:VolumeShaper
    VolumeShaper(支持版本改一下,minsdkversion:26,android8.0(api26)进一步学习对声音的编辑,可以让音频的声音有变化的播放 VolumeShaper.Configuration的三个参数 durati
    Android:VolumeShaper
  • Android崩溃异常捕获方法
    开发中最让人头疼的是应用突然爆炸,然后跳回到桌面。而且我们常常不知道这种状况会何时出现,在应用调试阶段还好,还可以通过调试工具的日志查看错误出现在哪里。但平时使用的时候给你闹崩溃,那你就欲哭无泪了。 那么今天主要讲一下如何去捕捉系统出现的U
    Android崩溃异常捕获方法
  • android开发教程之获取power_profile.xml文件的方法(android运行时能耗值)
    系统的设置–>电池–>使用情况中,统计的能耗的使用情况也是以power_profile.xml的value作为基础参数的1、我的手机中power_profile.xml的内容: HTC t328w代码如下:
    android开发教程之获取power_profile.xml文件的方法(android运行时能耗值)
  • Android SQLite数据库基本操作方法
    程序的最主要的功能在于对数据进行操作,通过对数据进行操作来实现某个功能。而数据库就是很重要的一个方面的,Android中内置了小巧轻便,功能却很强的一个数据库–SQLite数据库。那么就来看一下在Android程序中怎么去操作SQLite数
    Android SQLite数据库基本操作方法
  • ubuntu21.04怎么创建桌面快捷图标?ubuntu软件放到桌面的技巧
    工作的时候为了方便直接打开编辑文件,一些常用的软件或者文件我们会放在桌面,但是在ubuntu20.04下直接直接拖拽文件到桌面根本没有效果,在进入桌面后发现软件列表中的软件只能收藏到面板,无法复制到桌面使用,不知道为什么会这样,似乎并不是很
    ubuntu21.04怎么创建桌面快捷图标?ubuntu软件放到桌面的技巧
  • android获取当前手机号示例程序
    代码如下: public String getLocalNumber() { TelephonyManager tManager =
    android获取当前手机号示例程序
  • Android音视频开发(三)TextureView
    简介 TextureView与SurfaceView类似,可用于显示视频或OpenGL场景。 与SurfaceView的区别 SurfaceView不能使用变换和缩放等操作,不能叠加(Overlay)两个SurfaceView。 Textu
    Android音视频开发(三)TextureView
  • android获取屏幕高度和宽度的实现方法
    本文实例讲述了android获取屏幕高度和宽度的实现方法。分享给大家供大家参考。具体分析如下: 我们需要获取Android手机或Pad的屏幕的物理尺寸,以便于界面的设计或是其他功能的实现。下面就介绍讲一讲如何获取屏幕的物理尺寸 下面的代码即
    android获取屏幕高度和宽度的实现方法
  • Android自定义popupwindow实例代码
    先来看看效果图:一、布局
  • Android第一次实验
    一、实验原理 1.1实验目标 编程实现用户名与密码的存储与调用。 1.2实验要求 设计用户登录界面、登录成功界面、用户注册界面,用户注册时,将其用户名、密码保存到SharedPreference中,登录时输入用户名、密码,读取SharedP
    Android第一次实验

目录