駕校答題小程序實戰全過程【連載】——6.語音讀題

一、目標:

爲了更方便查看題目,我們加入讀題功能。語音讀題主要應用在智能客服機器人、電子有聲讀物、智慧教育等領域,瞭解到目前市場語音合成技術,主要有訊飛語音、百度語音、騰訊語音這幾家大廠。 都支持男女生聲,訊飛價格比較貴,這裏發現騰訊語音合成暫時不收費。
騰訊雲的語言合成介紹
https://cloud.tencent.com/product/tts#scenarios
摘選:語音合成(Text To Speech)滿足已知文本生成語音的需求,打通人機交互閉環。多種音色選擇,支持自定義音量、語速,爲企業客戶提供定製自有領域詞庫和個性化發音人服務,讓發音更自然、更專業、更符合場景需求。語音合成廣泛應用於語音導航、有聲讀物、標準發音領讀、自動新聞播報等場景。

本以爲這些API廠商,直接提供了API接口,小程序裏請求就好了,現實不是的,做法跟做微信支付有點類似。必須自己實現一套服務端API,服務端實現接口加密等操作。

這幾家都需要這樣做,這裏首先把需要的資料準備好。

  1. 開發語言 這裏選Golang,官方有服務端SDK
  2. 騰訊雲API密匙,自己在控制檯查看並記錄
  3. 開發文檔地址:https://cloud.tencent.com/document/api/441/18086
  4. 選一臺服務器,備案好域名,配置好https

二、編寫代碼

1.路由

beego.Router("/1/textToVoice", &controllers.CloudController{}, "post:TextToVoice")

2.控制器

func (cloud *CloudController) TextToVoice() {
    body := cloud.Ctx.Input.CopyBody(beego.BConfig.MaxMemory)
    js, err := simplejson.NewJson(body)
    if err != nil {
        cloud.responseError(err)
    }
    //獲取文本信息
    text := js.Get("text").MustString()
    //判斷不能爲空
    if strings.TrimSpace(text) == "" {
        cloud.responseError(fmt.Errorf("text param不能爲空"))
    }
    
//這裏初始化大家傳入自己騰訊雲的key信息
    client, _ := aai.NewClientWithSecretId(
        "id",
        "key",
        regions.Guangzhou)

    request := aai.NewTextToVoiceRequest()
    request.Text = common.StringPtr(text)
    request.SessionId = common.StringPtr(uuid.GetRandomString(16))
    request.ModelType = common.Int64Ptr(-1)
    request.ModelType = common.Int64Ptr(-1)
    request.Speed = common.Float64Ptr(0.8)
    response, err := client.TextToVoice(request)
    // 處理異常
    if _, ok := err.(*errors.TencentCloudSDKError); ok {
        cloud.responseError(fmt.Errorf("An API error has returned: %s", err))
    }
    // 非SDK異常,直接失敗。實際代碼中可以加入其他的處理。
    if err != nil {
        cloud.responseError(err)
    }
    // 打印返回的json字符串
    var base64Str *string = response.Response.Audio
    fileByte, err := models.Base64Decode([]byte(*base64Str))
    if err != nil {
        cloud.responseError(err)
    }

    fileName := uuid.GetRandomString(16) + "_" + fmt.Sprintf("%d", time.Now().Unix()) + ".wav"
    filePath := "/data/dyfsuda/app/restful/files/" + fileName
    url := "https://api.xxxx.com/files/" + fileName
//把文件寫入目錄
    if err = ioutil.WriteFile(filePath, fileByte, os.ModeAppend); err != nil {
        cloud.responseError(err)
    }
    if err = os.Chmod(filePath, 0777); err != nil {
        cloud.responseError(err)
    }
//返回文件路徑給客戶端
    cloud.Data["json"] = map[string]string{"url": url}
    cloud.ServeJSON()
}

這裏每次的題目可能都不一樣,所以就不更新到數據庫了,需要的時候,調用一次接口,如果接口收費,這裏就把語音文件路徑保存到數據表裏,每次判斷數據表是否存在語音就可以了。

目前開發這讀題還是需要自己有服務器,如果現成的API調用就好了。


三、開發回顧:

1.駕校答題小程序實戰全過程【連載】——1.數據庫設計
https://www.jianshu.com/p/ce67bfb5254c
2.駕校答題小程序實戰全過程【連載】——2.答題功能
https://www.jianshu.com/p/a63a8abe5223
3.駕校答題小程序實戰全過程【連載】——3.順序練習和模擬考試
https://www.jianshu.com/p/f64fef8edafb
4.駕校答題小程序實戰全過程【連載】——4.題目採集與測試
https://www.jianshu.com/p/60edb4d5562d
5.駕校答題小程序實戰全過程【連載】——5.數據導入
https://www.jianshu.com/p/ce687502381d
6.駕校答題小程序實戰全過程【連載】——6.語音讀題

該項目目前已經上線,需要源碼的朋友可以找我溝通,QQ:624235922

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章