android 语音合成的简单实现

原創

Dennis-Android

2020-02-25 00:31

一.语音合成是什么

语音合成也就是TextToSpeech，简称TTS，即把文本转换成语音的意思。安卓系统自带TTS引擎,默认为Pico引擎,如下图所示:

可惜的是Pico引擎不支持中文, 你也可以装上支持中文的第三方引擎,比如著名的科大讯飞,然后在在默认引擎那里把它勾选上,就可以了。

二. 实现语音合成

1.我们先用系统自带的TTS来实现吧.

代码很简单,创建一个TextToSpeech对象,先初始化配置,然后调用speak方法,传入三个参数就可以了,第一个参数为文本内容,第二个为发音模式,第三个传null即可.

        // 实例并初始化TTS对象
		mTextToSpeech = new TextToSpeech(this,new TextToSpeech.OnInitListener() {
					@Override
					public void onInit(int status) {
					 	  if (status == TextToSpeech.SUCCESS) {
							 // 设置朗读语言
							int supported = mTextToSpeech.setLanguage(Locale.ENGLISH);
							if ((supported != TextToSpeech.LANG_AVAILABLE)
									&& (supported != TextToSpeech.LANG_COUNTRY_AVAILABLE)) {
								Toast.makeText(MainActivity.this, "不支持当前语言",0).show();
							} 
						}  
					}
            	});

调用speak方法

               //朗读
		mTextToSpeech.speak(content,TextToSpeech.QUEUE_FLUSH, null);

2.使用科大讯飞实现

先去科大讯飞SDK官网创建应用,然后下载在线语音合成SDK,导入工程,进行一些配置。详细可以去查官网.

主要代码如下:

SpeechUtility.createUtility(context, SpeechConstant.APPID + "=571dd0b9");
 	    // 1.创建SpeechSynthesizer对象, 第二个参数：本地合成时传InitListener
		SpeechSynthesizer mTts = SpeechSynthesizer.createSynthesizer(context,
				null);
		// 2.合成参数设置，详见《科大讯飞MSC API手册(Android)》SpeechSynthesizer 类
		mTts.setParameter(SpeechConstant.VOICE_NAME, "xiaoyan");// 设置发音人
		mTts.setParameter(SpeechConstant.SPEED, "50");// 设置语速
		mTts.setParameter(SpeechConstant.VOLUME, "80");// 设置音量，范围0~100
		mTts.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_CLOUD); // 设置云端
		// 设置合成音频保存位置（可自定义保存位置），保存在“./sdcard/iflytek.pcm”
		// 保存在SD卡需要在AndroidManifest.xml添加写SD卡权限
		// 如果不需要保存合成音频，注释该行代码
		mTts.setParameter(SpeechConstant.TTS_AUDIO_PATH, "./sdcard/iflytek.pcm");
		// 3.开始合成
		mTts.startSpeaking(content, mSynListener);

需要传入一个合成监听器SynthesizerListener对象,可以监听开始播放、暂停播放等事件.

        // 合成监听器
	private SynthesizerListener mSynListener = new SynthesizerListener() {
		// 会话结束回调接口，没有错误时，error为null
		public void onCompleted(SpeechError error) {
		}

		// 缓冲进度回调
		// percent为缓冲进度0~100，beginPos为缓冲音频在文本中开始位置，endPos表示缓冲音频在文本中结束位置，info为附加信息。
		public void onBufferProgress(int percent, int beginPos, int endPos,
				String info) {
		}

		// 开始播放
		public void onSpeakBegin() {
		}

		// 暂停播放
		public void onSpeakPaused() {
		}

		// 播放进度回调
		// percent为播放进度0~100,beginPos为播放音频在文本中开始位置，endPos表示播放音频在文本中结束位置.
		public void onSpeakProgress(int percent, int beginPos, int endPos) {
		}

		// 恢复播放回调接口
		public void onSpeakResumed() {
		}

		// 会话事件回调接口
		public void onEvent(int arg0, int arg1, int arg2, Bundle arg3) {
		}

	};

这样就可以了。科大讯飞语音SDK还有很多功能,有兴趣的朋友可以去看看。

这是我自己做的Demo截图:

附上Demo下载地址:点击打开链接

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

android 语音合成的简单实现

Android系統的啓動流程簡要分析

Android系統啓動流程分析之啓動應用

Android系統啓動流程分析之安裝應用

Android4.4-Launcher源碼分析系列之關鍵的類和接口之DropTarget、DragSource

教你學會Android的NDK開發

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結