本文講述的是使用科大訊飛MSC SDK將語文字合成語音,然後以web接口的形式把合成的音頻數據返回前端。
流程
1、接收接口參數傳入的要合成的數據
2、使用MSC SDK把數據合成*.pcm文件
3、獲取wav文件格式頭
4、將格式頭與文件內容拼接返回
5、清空文件和生成的語音列表
資料
科大訊飛Java語音程序用戶指南
MSC Java API 文檔
WAV文件格式分析
java pcm to wav
以上資料來源於網絡,具體請點擊查看
主代碼
servlet
package voice;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.OutputStream;
import java.net.URLDecoder;
import javax.servlet.ServletException;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import com.iflytek.cloud.speech.SpeechConstant;
import com.iflytek.cloud.speech.SpeechSynthesizer;
import com.iflytek.cloud.speech.SpeechUtility;
import com.iflytek.cloud.speech.SynthesizeToUriListener;
@SuppressWarnings("serial")
public class TestXunFei extends HttpServlet {
public void doGet(HttpServletRequest request, HttpServletResponse response)
throws ServletException, IOException {
request.setCharacterEncoding("UTF-8");//解決亂碼
String data=URLDecoder.decode(request.getParameter("data"),"UTF-8");
System.out.println(data);
//換成你在訊飛申請的APPID
SpeechUtility.createUtility("appid=XXXXXX ");
//合成監聽器
SynthesizeToUriListener synthesizeToUriListener = XunfeiLib.getSynthesize();
String fileName=XunfeiLib.getFileName("tts_test.pcm");
XunfeiLib.delDone(fileName);
//1.創建SpeechSynthesizer對象
SpeechSynthesizer mTts= SpeechSynthesizer.createSynthesizer( );
//2.合成參數設置,詳見《MSC Reference Manual》SpeechSynthesizer 類
mTts.setParameter(SpeechConstant.VOICE_NAME, "xiaoyan");//設置發音人
mTts.setParameter(SpeechConstant.SPEED, "50");//設置語速,範圍0~100
mTts.setParameter(SpeechConstant.PITCH, "50");//設置語調,範圍0~100
mTts.setParameter(SpeechConstant.VOLUME, "50");//設置音量,範圍0~100
//3.開始合成
//設置合成音頻保存位置(可自定義保存位置),默認保存在“./tts_test.pcm”
mTts.synthesizeToUri(data,fileName ,synthesizeToUriListener);
//設置最長時間
int timeOut=30;
int star=0;
//校驗文件是否生成
while(!XunfeiLib.checkDone(fileName)){
try {
Thread.sleep(1000);
star++;
if(star>timeOut){
throw new Exception("合成超過"+timeOut+"秒!");
}
} catch (Exception e) {
// TODO 自動生成的 catch 塊
e.printStackTrace();
break;
}
}
this.sayPlay(fileName, request, response);
}
/**
* 將音頻內容輸出到請求中
*
* @param fileName
* @param request
* @param response
*/
private void sayPlay (String fileName,HttpServletRequest request,HttpServletResponse response) {
//輸出 wav IO流
try{
response.setHeader("Content-Type", "audio/mpeg");
File file = new File(fileName);
int len_l = (int) file.length();
byte[] buf = new byte[2048];
FileInputStream fis = new FileInputStream(file);
OutputStream out = response.getOutputStream();
//寫入WAV文件頭信息
out.write(XunfeiLib.getWAVHeader(len_l,8000,2,16));
len_l = fis.read(buf);
while (len_l != -1) {
out.write(buf, 0, len_l);
len_l = fis.read(buf);
}
out.flush();
out.close();
fis.close();
//刪除文件和清除隊列信息
XunfeiLib.delDone(fileName);
file.delete();
}catch (Exception e){
System.out.println(e);
}
}
}
輔助函數代碼
package voice;
import java.io.File;
import java.util.HashMap;
import java.util.Map;
import com.iflytek.cloud.speech.SpeechError;
import com.iflytek.cloud.speech.SynthesizeToUriListener;
public class XunfeiLib {
private static Map<String,Boolean> vioceFile=new HashMap<String, Boolean>();
/**
* 設置生成文件隊列
*
* @param name
* @param have
*/
public static void setVioce(String name ,Boolean have){
XunfeiLib.vioceFile.put(name, have);
}
/**
* 查看文件是否在隊列中
* @param name
* @return
*/
public static Boolean checkDone(String name){
Boolean don=XunfeiLib.vioceFile.get(name);
if(don==null){
return false;
}
return don;
}
/**
* 清除隊列中的信息
* @param name
*/
public static void delDone(String name){
XunfeiLib.vioceFile.remove(name);
}
/**
* 返回合成監視器
* @return
*/
public static SynthesizeToUriListener getSynthesize(){
return new SynthesizeToUriListener() {
//progress爲合成進度0~100
public void onBufferProgress(int progress) {
System.out.println("當前進度:"+progress+"%");
}
//會話合成完成回調接口
//uri爲合成保存地址,error爲錯誤信息,爲null時表示合成會話成功
public void onSynthesizeCompleted(String uri, SpeechError error) {
if(error!=null){
error.printStackTrace();
}else{
System.out.println("生成文件"+uri);
//將生成的文件保存到隊列中
XunfeiLib.setVioce(uri, true);
}
}
@Override
public void onEvent(int arg0, int arg1, int arg2, int arg3,
Object arg4, Object arg5) {
// TODO 自動生成的方法存根
}
};
}
/**
* 獲取文件名
*/
public static String getFileName(String name){
//獲取文件名
StringBuffer fileName=new StringBuffer(System.getProperty("user.dir"))
.append(File.separator).append("src")
.append(File.separator).append("main")
.append(File.separator).append("webapp")
.append(File.separator).append("WEB-INF")
.append(File.separator).append("cache")
.append(File.separator).append(name);//獲取文件路徑
System.out.println(fileName.toString());
return fileName.toString();
}
/**
* @param fileLeng 轉換文件長度
* @param srate 採樣率 - 8000,16000等
* @param channel 通道數量 - 單聲道= 1,立體聲= 2等。
* @param format 每個樣本的位數(這裏是16)
* @throws IOException
*/
public static byte[] getWAVHeader(long fileLeng, int srate, int channel, int format) {
byte[] header = new byte[44];
long totalDataLen = fileLeng + 36;
long bitrate = srate * channel * format;
header[0] = 'R';
header[1] = 'I';
header[2] = 'F';
header[3] = 'F';
header[4] = (byte) (totalDataLen & 0xff);
header[5] = (byte) ((totalDataLen >> 8) & 0xff);
header[6] = (byte) ((totalDataLen >> 16) & 0xff);
header[7] = (byte) ((totalDataLen >> 24) & 0xff);
header[8] = 'W';
header[9] = 'A';
header[10] = 'V';
header[11] = 'E';
header[12] = 'f';
header[13] = 'm';
header[14] = 't';
header[15] = ' ';
header[16] = (byte) format;
header[17] = 0;
header[18] = 0;
header[19] = 0;
header[20] = 1;
header[21] = 0;
header[22] = (byte) channel;
header[23] = 0;
header[24] = (byte) (srate & 0xff);
header[25] = (byte) ((srate >> 8) & 0xff);
header[26] = (byte) ((srate >> 16) & 0xff);
header[27] = (byte) ((srate >> 24) & 0xff);
header[28] = (byte) ((bitrate / 8) & 0xff);
header[29] = (byte) (((bitrate / 8) >> 8) & 0xff);
header[30] = (byte) (((bitrate / 8) >> 16) & 0xff);
header[31] = (byte) (((bitrate / 8) >> 24) & 0xff);
header[32] = (byte) ((channel * format) / 8);
header[33] = 0;
header[34] = 16;
header[35] = 0;
header[36] = 'd';
header[37] = 'a';
header[38] = 't';
header[39] = 'a';
header[40] = (byte) (fileLeng & 0xff);
header[41] = (byte) ((fileLeng >> 8) & 0xff);
header[42] = (byte) ((fileLeng >> 16) & 0xff);
header[43] = (byte) ((fileLeng >> 24) & 0xff);
return header;
}
}
調用測試
http://**你的地址**/TestXunFei?data=哈哈哈哈哈哈哈哈,今天很高興,真的真的很高興
圖片
總結
1、在檢測文件是否生成的時候,循環的while還可以有優化的空間。
2、還有生成的文件名也可以隨機生成,這樣在多用戶請求的時候就不會衝突,這裏也可以有優化和邊界控制的必要。
3、傳入的參數也可以設置的更多,可以讓用戶有更多的選擇。
4、鑑於這只是一個例子以上的可優化和可擴展就不給出了。哈哈哈~
5、tomcat字符編碼記得設置UTF-8,因爲tomcat-8之前的默認編碼是ISO-8859-1,而tomcat-8的默認編碼爲UTF-8。請自行轉換,如若不然對中文的支持會有所影響!
6、記得將需要的文件放入\tomcat\bin目錄(libmsc32.so libmsc64.so msc32.dll msc64.dll)