Java 使用科大讯飞MSC SDK,在web服务端将文字合成语音,将pcm文件转为wav格式返回

本文讲述的是使用科大讯飞MSC SDK将语文字合成语音,然后以web接口的形式把合成的音频数据返回前端。

流程

1、接收接口参数传入的要合成的数据
2、使用MSC SDK把数据合成*.pcm文件
3、获取wav文件格式头
4、将格式头与文件内容拼接返回
5、清空文件和生成的语音列表

资料

科大讯飞Java语音程序用户指南
MSC Java API 文档
WAV文件格式分析
java pcm to wav

以上资料来源于网络,具体请点击查看

主代码

servlet

package voice;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.OutputStream;
import java.net.URLDecoder;

import javax.servlet.ServletException;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;

import com.iflytek.cloud.speech.SpeechConstant;
import com.iflytek.cloud.speech.SpeechSynthesizer;
import com.iflytek.cloud.speech.SpeechUtility;
import com.iflytek.cloud.speech.SynthesizeToUriListener;

@SuppressWarnings("serial")
public class TestXunFei extends HttpServlet {


    public void doGet(HttpServletRequest request, HttpServletResponse response)
            throws ServletException, IOException {

        request.setCharacterEncoding("UTF-8");//解决乱码

        String data=URLDecoder.decode(request.getParameter("data"),"UTF-8");
        System.out.println(data);
        //换成你在讯飞申请的APPID
        SpeechUtility.createUtility("appid=XXXXXX ");

        //合成监听器
        SynthesizeToUriListener synthesizeToUriListener = XunfeiLib.getSynthesize();

        String fileName=XunfeiLib.getFileName("tts_test.pcm");
        XunfeiLib.delDone(fileName);

        //1.创建SpeechSynthesizer对象
        SpeechSynthesizer mTts= SpeechSynthesizer.createSynthesizer( );
        //2.合成参数设置,详见《MSC Reference Manual》SpeechSynthesizer 类
        mTts.setParameter(SpeechConstant.VOICE_NAME, "xiaoyan");//设置发音人
        mTts.setParameter(SpeechConstant.SPEED, "50");//设置语速,范围0~100
        mTts.setParameter(SpeechConstant.PITCH, "50");//设置语调,范围0~100
        mTts.setParameter(SpeechConstant.VOLUME, "50");//设置音量,范围0~100

        //3.开始合成
        //设置合成音频保存位置(可自定义保存位置),默认保存在“./tts_test.pcm”
        mTts.synthesizeToUri(data,fileName ,synthesizeToUriListener);

        //设置最长时间
        int timeOut=30;
        int star=0;

        //校验文件是否生成
        while(!XunfeiLib.checkDone(fileName)){

            try {           
                Thread.sleep(1000);
                star++;             
                if(star>timeOut){
                    throw new Exception("合成超过"+timeOut+"秒!");
                }
            } catch (Exception e) {
                // TODO 自动生成的 catch 块
                e.printStackTrace();
                break;
            } 

        }

        this.sayPlay(fileName, request, response);
    }
    /**
     * 将音频内容输出到请求中
     * 
     * @param fileName
     * @param request
     * @param response
     */
    private  void sayPlay (String fileName,HttpServletRequest request,HttpServletResponse response) {

         //输出 wav IO流
         try{

             response.setHeader("Content-Type", "audio/mpeg");
             File file = new File(fileName);
             int len_l = (int) file.length();
             byte[] buf = new byte[2048];
             FileInputStream fis = new FileInputStream(file);
             OutputStream out = response.getOutputStream();

             //写入WAV文件头信息
             out.write(XunfeiLib.getWAVHeader(len_l,8000,2,16));

             len_l = fis.read(buf);
             while (len_l != -1) {
                 out.write(buf, 0, len_l);
                len_l = fis.read(buf);
             }
             out.flush();
             out.close();
             fis.close();

             //删除文件和清除队列信息
             XunfeiLib.delDone(fileName);
             file.delete();
         }catch (Exception e){
             System.out.println(e);
         }     

    }

}

辅助函数代码

package voice;

import java.io.File;
import java.util.HashMap;
import java.util.Map;

import com.iflytek.cloud.speech.SpeechError;
import com.iflytek.cloud.speech.SynthesizeToUriListener;

public class XunfeiLib  {


    private static Map<String,Boolean> vioceFile=new HashMap<String, Boolean>();

    /**
     * 设置生成文件队列
     * 
     * @param name
     * @param have
     */
    public static void setVioce(String name ,Boolean have){
        XunfeiLib.vioceFile.put(name, have);
    }
    /**
     * 查看文件是否在队列中
     * @param name
     * @return
     */
    public static Boolean checkDone(String name){
        Boolean don=XunfeiLib.vioceFile.get(name);
        if(don==null){
            return false;
        }
        return don;
    }
    /**
     * 清除队列中的信息
     * @param name
     */
    public static void delDone(String name){
        XunfeiLib.vioceFile.remove(name);
    }
    /**
     * 返回合成监视器
     * @return
     */
    public static SynthesizeToUriListener getSynthesize(){
        return new SynthesizeToUriListener() {
            //progress为合成进度0~100 
            public void onBufferProgress(int progress) {
                System.out.println("当前进度:"+progress+"%");
            }
            //会话合成完成回调接口
            //uri为合成保存地址,error为错误信息,为null时表示合成会话成功
            public void onSynthesizeCompleted(String uri, SpeechError error) {
                if(error!=null){
                    error.printStackTrace();
                }else{
                System.out.println("生成文件"+uri);
                //将生成的文件保存到队列中
                XunfeiLib.setVioce(uri, true);
                }
            }
            @Override
            public void onEvent(int arg0, int arg1, int arg2, int arg3,
                    Object arg4, Object arg5) {
                // TODO 自动生成的方法存根

            }
        };
    }
     /**
     * 获取文件名
     */
    public static String getFileName(String name){
        //获取文件名
        StringBuffer fileName=new StringBuffer(System.getProperty("user.dir"))
                .append(File.separator).append("src")
                .append(File.separator).append("main")
                .append(File.separator).append("webapp")
                .append(File.separator).append("WEB-INF")
                .append(File.separator).append("cache")
                .append(File.separator).append(name);//获取文件路径

        System.out.println(fileName.toString());

        return fileName.toString();
    }
    /**
     * @param fileLeng  转换文件长度
     * @param srate  采样率 - 8000,16000等
     * @param channel 通道数量 - 单声道= 1,立体声= 2等。
     * @param format 每个样本的位数(这里是16)
     * @throws IOException
     */   

    public static byte[] getWAVHeader(long fileLeng, int srate, int channel, int format) {

        byte[] header = new byte[44];
        long totalDataLen = fileLeng + 36;
        long bitrate = srate * channel * format;

        header[0] = 'R'; 
        header[1] = 'I';
        header[2] = 'F';
        header[3] = 'F';
        header[4] = (byte) (totalDataLen & 0xff);
        header[5] = (byte) ((totalDataLen >> 8) & 0xff);
        header[6] = (byte) ((totalDataLen >> 16) & 0xff);
        header[7] = (byte) ((totalDataLen >> 24) & 0xff);
        header[8] = 'W';
        header[9] = 'A';
        header[10] = 'V';
        header[11] = 'E';
        header[12] = 'f'; 
        header[13] = 'm';
        header[14] = 't';
        header[15] = ' ';
        header[16] = (byte) format; 
        header[17] = 0;
        header[18] = 0;
        header[19] = 0;
        header[20] = 1; 
        header[21] = 0;
        header[22] = (byte) channel; 
        header[23] = 0;
        header[24] = (byte) (srate & 0xff);
        header[25] = (byte) ((srate >> 8) & 0xff);
        header[26] = (byte) ((srate >> 16) & 0xff);
        header[27] = (byte) ((srate >> 24) & 0xff);
        header[28] = (byte) ((bitrate / 8) & 0xff);
        header[29] = (byte) (((bitrate / 8) >> 8) & 0xff);
        header[30] = (byte) (((bitrate / 8) >> 16) & 0xff);
        header[31] = (byte) (((bitrate / 8) >> 24) & 0xff);
        header[32] = (byte) ((channel * format) / 8); 
        header[33] = 0;
        header[34] = 16; 
        header[35] = 0;
        header[36] = 'd';
        header[37] = 'a';
        header[38] = 't';
        header[39] = 'a';
        header[40] = (byte) (fileLeng  & 0xff);
        header[41] = (byte) ((fileLeng >> 8) & 0xff);
        header[42] = (byte) ((fileLeng >> 16) & 0xff);
        header[43] = (byte) ((fileLeng >> 24) & 0xff);

        return header;
    }

}

调用测试

http://**你的地址**/TestXunFei?data=哈哈哈哈哈哈哈哈,今天很高兴,真的真的很高兴

图片

这里写图片描述

总结

1、在检测文件是否生成的时候,循环的while还可以有优化的空间。
2、还有生成的文件名也可以随机生成,这样在多用户请求的时候就不会冲突,这里也可以有优化和边界控制的必要。
3、传入的参数也可以设置的更多,可以让用户有更多的选择。
4、鉴于这只是一个例子以上的可优化和可扩展就不给出了。哈哈哈~
5、tomcat字符编码记得设置UTF-8,因为tomcat-8之前的默认编码是ISO-8859-1,而tomcat-8的默认编码为UTF-8。请自行转换,如若不然对中文的支持会有所影响!
6、记得将需要的文件放入\tomcat\bin目录(libmsc32.so libmsc64.so msc32.dll msc64.dll)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章