Java 使用科大訊飛MSC SDK,在web服務端將文字合成語音,將pcm文件轉爲wav格式返回

本文講述的是使用科大訊飛MSC SDK將語文字合成語音,然後以web接口的形式把合成的音頻數據返回前端。

流程

1、接收接口參數傳入的要合成的數據
2、使用MSC SDK把數據合成*.pcm文件
3、獲取wav文件格式頭
4、將格式頭與文件內容拼接返回
5、清空文件和生成的語音列表

資料

科大訊飛Java語音程序用戶指南
MSC Java API 文檔
WAV文件格式分析
java pcm to wav

以上資料來源於網絡,具體請點擊查看

主代碼

servlet

package voice;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.OutputStream;
import java.net.URLDecoder;

import javax.servlet.ServletException;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;

import com.iflytek.cloud.speech.SpeechConstant;
import com.iflytek.cloud.speech.SpeechSynthesizer;
import com.iflytek.cloud.speech.SpeechUtility;
import com.iflytek.cloud.speech.SynthesizeToUriListener;

@SuppressWarnings("serial")
public class TestXunFei extends HttpServlet {


    public void doGet(HttpServletRequest request, HttpServletResponse response)
            throws ServletException, IOException {

        request.setCharacterEncoding("UTF-8");//解決亂碼

        String data=URLDecoder.decode(request.getParameter("data"),"UTF-8");
        System.out.println(data);
        //換成你在訊飛申請的APPID
        SpeechUtility.createUtility("appid=XXXXXX ");

        //合成監聽器
        SynthesizeToUriListener synthesizeToUriListener = XunfeiLib.getSynthesize();

        String fileName=XunfeiLib.getFileName("tts_test.pcm");
        XunfeiLib.delDone(fileName);

        //1.創建SpeechSynthesizer對象
        SpeechSynthesizer mTts= SpeechSynthesizer.createSynthesizer( );
        //2.合成參數設置,詳見《MSC Reference Manual》SpeechSynthesizer 類
        mTts.setParameter(SpeechConstant.VOICE_NAME, "xiaoyan");//設置發音人
        mTts.setParameter(SpeechConstant.SPEED, "50");//設置語速,範圍0~100
        mTts.setParameter(SpeechConstant.PITCH, "50");//設置語調,範圍0~100
        mTts.setParameter(SpeechConstant.VOLUME, "50");//設置音量,範圍0~100

        //3.開始合成
        //設置合成音頻保存位置(可自定義保存位置),默認保存在“./tts_test.pcm”
        mTts.synthesizeToUri(data,fileName ,synthesizeToUriListener);

        //設置最長時間
        int timeOut=30;
        int star=0;

        //校驗文件是否生成
        while(!XunfeiLib.checkDone(fileName)){

            try {           
                Thread.sleep(1000);
                star++;             
                if(star>timeOut){
                    throw new Exception("合成超過"+timeOut+"秒!");
                }
            } catch (Exception e) {
                // TODO 自動生成的 catch 塊
                e.printStackTrace();
                break;
            } 

        }

        this.sayPlay(fileName, request, response);
    }
    /**
     * 將音頻內容輸出到請求中
     * 
     * @param fileName
     * @param request
     * @param response
     */
    private  void sayPlay (String fileName,HttpServletRequest request,HttpServletResponse response) {

         //輸出 wav IO流
         try{

             response.setHeader("Content-Type", "audio/mpeg");
             File file = new File(fileName);
             int len_l = (int) file.length();
             byte[] buf = new byte[2048];
             FileInputStream fis = new FileInputStream(file);
             OutputStream out = response.getOutputStream();

             //寫入WAV文件頭信息
             out.write(XunfeiLib.getWAVHeader(len_l,8000,2,16));

             len_l = fis.read(buf);
             while (len_l != -1) {
                 out.write(buf, 0, len_l);
                len_l = fis.read(buf);
             }
             out.flush();
             out.close();
             fis.close();

             //刪除文件和清除隊列信息
             XunfeiLib.delDone(fileName);
             file.delete();
         }catch (Exception e){
             System.out.println(e);
         }     

    }

}

輔助函數代碼

package voice;

import java.io.File;
import java.util.HashMap;
import java.util.Map;

import com.iflytek.cloud.speech.SpeechError;
import com.iflytek.cloud.speech.SynthesizeToUriListener;

public class XunfeiLib  {


    private static Map<String,Boolean> vioceFile=new HashMap<String, Boolean>();

    /**
     * 設置生成文件隊列
     * 
     * @param name
     * @param have
     */
    public static void setVioce(String name ,Boolean have){
        XunfeiLib.vioceFile.put(name, have);
    }
    /**
     * 查看文件是否在隊列中
     * @param name
     * @return
     */
    public static Boolean checkDone(String name){
        Boolean don=XunfeiLib.vioceFile.get(name);
        if(don==null){
            return false;
        }
        return don;
    }
    /**
     * 清除隊列中的信息
     * @param name
     */
    public static void delDone(String name){
        XunfeiLib.vioceFile.remove(name);
    }
    /**
     * 返回合成監視器
     * @return
     */
    public static SynthesizeToUriListener getSynthesize(){
        return new SynthesizeToUriListener() {
            //progress爲合成進度0~100 
            public void onBufferProgress(int progress) {
                System.out.println("當前進度:"+progress+"%");
            }
            //會話合成完成回調接口
            //uri爲合成保存地址,error爲錯誤信息,爲null時表示合成會話成功
            public void onSynthesizeCompleted(String uri, SpeechError error) {
                if(error!=null){
                    error.printStackTrace();
                }else{
                System.out.println("生成文件"+uri);
                //將生成的文件保存到隊列中
                XunfeiLib.setVioce(uri, true);
                }
            }
            @Override
            public void onEvent(int arg0, int arg1, int arg2, int arg3,
                    Object arg4, Object arg5) {
                // TODO 自動生成的方法存根

            }
        };
    }
     /**
     * 獲取文件名
     */
    public static String getFileName(String name){
        //獲取文件名
        StringBuffer fileName=new StringBuffer(System.getProperty("user.dir"))
                .append(File.separator).append("src")
                .append(File.separator).append("main")
                .append(File.separator).append("webapp")
                .append(File.separator).append("WEB-INF")
                .append(File.separator).append("cache")
                .append(File.separator).append(name);//獲取文件路徑

        System.out.println(fileName.toString());

        return fileName.toString();
    }
    /**
     * @param fileLeng  轉換文件長度
     * @param srate  採樣率 - 8000,16000等
     * @param channel 通道數量 - 單聲道= 1,立體聲= 2等。
     * @param format 每個樣本的位數(這裏是16)
     * @throws IOException
     */   

    public static byte[] getWAVHeader(long fileLeng, int srate, int channel, int format) {

        byte[] header = new byte[44];
        long totalDataLen = fileLeng + 36;
        long bitrate = srate * channel * format;

        header[0] = 'R'; 
        header[1] = 'I';
        header[2] = 'F';
        header[3] = 'F';
        header[4] = (byte) (totalDataLen & 0xff);
        header[5] = (byte) ((totalDataLen >> 8) & 0xff);
        header[6] = (byte) ((totalDataLen >> 16) & 0xff);
        header[7] = (byte) ((totalDataLen >> 24) & 0xff);
        header[8] = 'W';
        header[9] = 'A';
        header[10] = 'V';
        header[11] = 'E';
        header[12] = 'f'; 
        header[13] = 'm';
        header[14] = 't';
        header[15] = ' ';
        header[16] = (byte) format; 
        header[17] = 0;
        header[18] = 0;
        header[19] = 0;
        header[20] = 1; 
        header[21] = 0;
        header[22] = (byte) channel; 
        header[23] = 0;
        header[24] = (byte) (srate & 0xff);
        header[25] = (byte) ((srate >> 8) & 0xff);
        header[26] = (byte) ((srate >> 16) & 0xff);
        header[27] = (byte) ((srate >> 24) & 0xff);
        header[28] = (byte) ((bitrate / 8) & 0xff);
        header[29] = (byte) (((bitrate / 8) >> 8) & 0xff);
        header[30] = (byte) (((bitrate / 8) >> 16) & 0xff);
        header[31] = (byte) (((bitrate / 8) >> 24) & 0xff);
        header[32] = (byte) ((channel * format) / 8); 
        header[33] = 0;
        header[34] = 16; 
        header[35] = 0;
        header[36] = 'd';
        header[37] = 'a';
        header[38] = 't';
        header[39] = 'a';
        header[40] = (byte) (fileLeng  & 0xff);
        header[41] = (byte) ((fileLeng >> 8) & 0xff);
        header[42] = (byte) ((fileLeng >> 16) & 0xff);
        header[43] = (byte) ((fileLeng >> 24) & 0xff);

        return header;
    }

}

調用測試

http://**你的地址**/TestXunFei?data=哈哈哈哈哈哈哈哈,今天很高興,真的真的很高興

圖片

這裏寫圖片描述

總結

1、在檢測文件是否生成的時候,循環的while還可以有優化的空間。
2、還有生成的文件名也可以隨機生成,這樣在多用戶請求的時候就不會衝突,這裏也可以有優化和邊界控制的必要。
3、傳入的參數也可以設置的更多,可以讓用戶有更多的選擇。
4、鑑於這只是一個例子以上的可優化和可擴展就不給出了。哈哈哈~
5、tomcat字符編碼記得設置UTF-8,因爲tomcat-8之前的默認編碼是ISO-8859-1,而tomcat-8的默認編碼爲UTF-8。請自行轉換,如若不然對中文的支持會有所影響!
6、記得將需要的文件放入\tomcat\bin目錄(libmsc32.so libmsc64.so msc32.dll msc64.dll)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章