本文讲述的是使用科大讯飞MSC SDK将语文字合成语音,然后以web接口的形式把合成的音频数据返回前端。
流程
1、接收接口参数传入的要合成的数据
2、使用MSC SDK把数据合成*.pcm文件
3、获取wav文件格式头
4、将格式头与文件内容拼接返回
5、清空文件和生成的语音列表
资料
科大讯飞Java语音程序用户指南
MSC Java API 文档
WAV文件格式分析
java pcm to wav
以上资料来源于网络,具体请点击查看
主代码
servlet
package voice;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.OutputStream;
import java.net.URLDecoder;
import javax.servlet.ServletException;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import com.iflytek.cloud.speech.SpeechConstant;
import com.iflytek.cloud.speech.SpeechSynthesizer;
import com.iflytek.cloud.speech.SpeechUtility;
import com.iflytek.cloud.speech.SynthesizeToUriListener;
@SuppressWarnings("serial")
public class TestXunFei extends HttpServlet {
public void doGet(HttpServletRequest request, HttpServletResponse response)
throws ServletException, IOException {
request.setCharacterEncoding("UTF-8");//解决乱码
String data=URLDecoder.decode(request.getParameter("data"),"UTF-8");
System.out.println(data);
//换成你在讯飞申请的APPID
SpeechUtility.createUtility("appid=XXXXXX ");
//合成监听器
SynthesizeToUriListener synthesizeToUriListener = XunfeiLib.getSynthesize();
String fileName=XunfeiLib.getFileName("tts_test.pcm");
XunfeiLib.delDone(fileName);
//1.创建SpeechSynthesizer对象
SpeechSynthesizer mTts= SpeechSynthesizer.createSynthesizer( );
//2.合成参数设置,详见《MSC Reference Manual》SpeechSynthesizer 类
mTts.setParameter(SpeechConstant.VOICE_NAME, "xiaoyan");//设置发音人
mTts.setParameter(SpeechConstant.SPEED, "50");//设置语速,范围0~100
mTts.setParameter(SpeechConstant.PITCH, "50");//设置语调,范围0~100
mTts.setParameter(SpeechConstant.VOLUME, "50");//设置音量,范围0~100
//3.开始合成
//设置合成音频保存位置(可自定义保存位置),默认保存在“./tts_test.pcm”
mTts.synthesizeToUri(data,fileName ,synthesizeToUriListener);
//设置最长时间
int timeOut=30;
int star=0;
//校验文件是否生成
while(!XunfeiLib.checkDone(fileName)){
try {
Thread.sleep(1000);
star++;
if(star>timeOut){
throw new Exception("合成超过"+timeOut+"秒!");
}
} catch (Exception e) {
// TODO 自动生成的 catch 块
e.printStackTrace();
break;
}
}
this.sayPlay(fileName, request, response);
}
/**
* 将音频内容输出到请求中
*
* @param fileName
* @param request
* @param response
*/
private void sayPlay (String fileName,HttpServletRequest request,HttpServletResponse response) {
//输出 wav IO流
try{
response.setHeader("Content-Type", "audio/mpeg");
File file = new File(fileName);
int len_l = (int) file.length();
byte[] buf = new byte[2048];
FileInputStream fis = new FileInputStream(file);
OutputStream out = response.getOutputStream();
//写入WAV文件头信息
out.write(XunfeiLib.getWAVHeader(len_l,8000,2,16));
len_l = fis.read(buf);
while (len_l != -1) {
out.write(buf, 0, len_l);
len_l = fis.read(buf);
}
out.flush();
out.close();
fis.close();
//删除文件和清除队列信息
XunfeiLib.delDone(fileName);
file.delete();
}catch (Exception e){
System.out.println(e);
}
}
}
辅助函数代码
package voice;
import java.io.File;
import java.util.HashMap;
import java.util.Map;
import com.iflytek.cloud.speech.SpeechError;
import com.iflytek.cloud.speech.SynthesizeToUriListener;
public class XunfeiLib {
private static Map<String,Boolean> vioceFile=new HashMap<String, Boolean>();
/**
* 设置生成文件队列
*
* @param name
* @param have
*/
public static void setVioce(String name ,Boolean have){
XunfeiLib.vioceFile.put(name, have);
}
/**
* 查看文件是否在队列中
* @param name
* @return
*/
public static Boolean checkDone(String name){
Boolean don=XunfeiLib.vioceFile.get(name);
if(don==null){
return false;
}
return don;
}
/**
* 清除队列中的信息
* @param name
*/
public static void delDone(String name){
XunfeiLib.vioceFile.remove(name);
}
/**
* 返回合成监视器
* @return
*/
public static SynthesizeToUriListener getSynthesize(){
return new SynthesizeToUriListener() {
//progress为合成进度0~100
public void onBufferProgress(int progress) {
System.out.println("当前进度:"+progress+"%");
}
//会话合成完成回调接口
//uri为合成保存地址,error为错误信息,为null时表示合成会话成功
public void onSynthesizeCompleted(String uri, SpeechError error) {
if(error!=null){
error.printStackTrace();
}else{
System.out.println("生成文件"+uri);
//将生成的文件保存到队列中
XunfeiLib.setVioce(uri, true);
}
}
@Override
public void onEvent(int arg0, int arg1, int arg2, int arg3,
Object arg4, Object arg5) {
// TODO 自动生成的方法存根
}
};
}
/**
* 获取文件名
*/
public static String getFileName(String name){
//获取文件名
StringBuffer fileName=new StringBuffer(System.getProperty("user.dir"))
.append(File.separator).append("src")
.append(File.separator).append("main")
.append(File.separator).append("webapp")
.append(File.separator).append("WEB-INF")
.append(File.separator).append("cache")
.append(File.separator).append(name);//获取文件路径
System.out.println(fileName.toString());
return fileName.toString();
}
/**
* @param fileLeng 转换文件长度
* @param srate 采样率 - 8000,16000等
* @param channel 通道数量 - 单声道= 1,立体声= 2等。
* @param format 每个样本的位数(这里是16)
* @throws IOException
*/
public static byte[] getWAVHeader(long fileLeng, int srate, int channel, int format) {
byte[] header = new byte[44];
long totalDataLen = fileLeng + 36;
long bitrate = srate * channel * format;
header[0] = 'R';
header[1] = 'I';
header[2] = 'F';
header[3] = 'F';
header[4] = (byte) (totalDataLen & 0xff);
header[5] = (byte) ((totalDataLen >> 8) & 0xff);
header[6] = (byte) ((totalDataLen >> 16) & 0xff);
header[7] = (byte) ((totalDataLen >> 24) & 0xff);
header[8] = 'W';
header[9] = 'A';
header[10] = 'V';
header[11] = 'E';
header[12] = 'f';
header[13] = 'm';
header[14] = 't';
header[15] = ' ';
header[16] = (byte) format;
header[17] = 0;
header[18] = 0;
header[19] = 0;
header[20] = 1;
header[21] = 0;
header[22] = (byte) channel;
header[23] = 0;
header[24] = (byte) (srate & 0xff);
header[25] = (byte) ((srate >> 8) & 0xff);
header[26] = (byte) ((srate >> 16) & 0xff);
header[27] = (byte) ((srate >> 24) & 0xff);
header[28] = (byte) ((bitrate / 8) & 0xff);
header[29] = (byte) (((bitrate / 8) >> 8) & 0xff);
header[30] = (byte) (((bitrate / 8) >> 16) & 0xff);
header[31] = (byte) (((bitrate / 8) >> 24) & 0xff);
header[32] = (byte) ((channel * format) / 8);
header[33] = 0;
header[34] = 16;
header[35] = 0;
header[36] = 'd';
header[37] = 'a';
header[38] = 't';
header[39] = 'a';
header[40] = (byte) (fileLeng & 0xff);
header[41] = (byte) ((fileLeng >> 8) & 0xff);
header[42] = (byte) ((fileLeng >> 16) & 0xff);
header[43] = (byte) ((fileLeng >> 24) & 0xff);
return header;
}
}
调用测试
http://**你的地址**/TestXunFei?data=哈哈哈哈哈哈哈哈,今天很高兴,真的真的很高兴
图片
总结
1、在检测文件是否生成的时候,循环的while还可以有优化的空间。
2、还有生成的文件名也可以随机生成,这样在多用户请求的时候就不会冲突,这里也可以有优化和边界控制的必要。
3、传入的参数也可以设置的更多,可以让用户有更多的选择。
4、鉴于这只是一个例子以上的可优化和可扩展就不给出了。哈哈哈~
5、tomcat字符编码记得设置UTF-8,因为tomcat-8之前的默认编码是ISO-8859-1,而tomcat-8的默认编码为UTF-8。请自行转换,如若不然对中文的支持会有所影响!
6、记得将需要的文件放入\tomcat\bin目录(libmsc32.so libmsc64.so msc32.dll msc64.dll)