android 语音合成的简单实现

一.语音合成是什么

         语音合成也就是TextToSpeech,简称TTS,即把文本转换成语音的意思。安卓系统自带TTS引擎,默认为Pico引擎,如下图所示:

      

      可惜的是Pico引擎不支持中文,  你也可以装上支持中文的第三方引擎,比如著名的科大讯飞,然后在在默认引擎那里把它勾选上,就可以了。

 二. 实现语音合成

     1.我们先用系统自带的TTS来实现吧.

      代码很简单,创建一个TextToSpeech对象,先初始化配置,然后调用speak方法,传入三个参数就可以了,第一个参数为文本内容,第二个为发音模式,第三个传null即可. 

        // 实例并初始化TTS对象
		mTextToSpeech = new TextToSpeech(this,new TextToSpeech.OnInitListener() {
					@Override
					public void onInit(int status) {
					 	  if (status == TextToSpeech.SUCCESS) {
							 // 设置朗读语言
							int supported = mTextToSpeech.setLanguage(Locale.ENGLISH);
							if ((supported != TextToSpeech.LANG_AVAILABLE)
									&& (supported != TextToSpeech.LANG_COUNTRY_AVAILABLE)) {
								Toast.makeText(MainActivity.this, "不支持当前语言",0).show();
							} 
						}  
					}
            	}); 
     调用speak方法

               //朗读
		mTextToSpeech.speak(content,TextToSpeech.QUEUE_FLUSH, null);
     2.使用科大讯飞实现

      先去科大讯飞SDK官网创建应用,然后下载在线语音合成SDK,导入工程,进行一些配置。详细可以去查官网.

      主要代码如下:

SpeechUtility.createUtility(context, SpeechConstant.APPID + "=571dd0b9");
 	    // 1.创建SpeechSynthesizer对象, 第二个参数:本地合成时传InitListener
		SpeechSynthesizer mTts = SpeechSynthesizer.createSynthesizer(context,
				null);
		// 2.合成参数设置,详见《科大讯飞MSC API手册(Android)》SpeechSynthesizer 类
		mTts.setParameter(SpeechConstant.VOICE_NAME, "xiaoyan");// 设置发音人
		mTts.setParameter(SpeechConstant.SPEED, "50");// 设置语速
		mTts.setParameter(SpeechConstant.VOLUME, "80");// 设置音量,范围0~100
		mTts.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_CLOUD); // 设置云端
		// 设置合成音频保存位置(可自定义保存位置),保存在“./sdcard/iflytek.pcm”
		// 保存在SD卡需要在AndroidManifest.xml添加写SD卡权限
		// 如果不需要保存合成音频,注释该行代码
		mTts.setParameter(SpeechConstant.TTS_AUDIO_PATH, "./sdcard/iflytek.pcm");
		// 3.开始合成
		mTts.startSpeaking(content, mSynListener);
      需要传入一个合成监听器SynthesizerListener对象,可以监听开始播放、暂停播放等事件.

        // 合成监听器
	private SynthesizerListener mSynListener = new SynthesizerListener() {
		// 会话结束回调接口,没有错误时,error为null
		public void onCompleted(SpeechError error) {
		}

		// 缓冲进度回调
		// percent为缓冲进度0~100,beginPos为缓冲音频在文本中开始位置,endPos表示缓冲音频在文本中结束位置,info为附加信息。
		public void onBufferProgress(int percent, int beginPos, int endPos,
				String info) {
		}

		// 开始播放
		public void onSpeakBegin() {
		}

		// 暂停播放
		public void onSpeakPaused() {
		}

		// 播放进度回调
		// percent为播放进度0~100,beginPos为播放音频在文本中开始位置,endPos表示播放音频在文本中结束位置.
		public void onSpeakProgress(int percent, int beginPos, int endPos) {
		}

		// 恢复播放回调接口
		public void onSpeakResumed() {
		}

		// 会话事件回调接口
		public void onEvent(int arg0, int arg1, int arg2, Bundle arg3) {
		}

	};
         这样就可以了。科大讯飞语音SDK还有很多功能,有兴趣的朋友可以去看看。

         这是我自己做的Demo截图:

         

        附上Demo下载地址:点击打开链接


 

            



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章