智能(語音)對話系統架構研究

    本文所談及的架構主要指使用已有的智能對話服務來搭建一個應用系統,而不會深入的探討智能對話服務內部的架構。

智能對話系統的需求目標

    智能對話系統可以提供回答問題的能力,即在理解自然語言的基礎上,解答用戶提出的問題。進一步的,可以提供基於任務的對話能力,及判斷用戶的意圖,通過多輪對話收集必要的信息,完成訂票,查找音樂等服務。

智能對話系統的架構概覽

    上圖是阿里雲智能對話平臺文檔中的智能語音交互系統架構圖,從架構圖中可以看到有以下重要的組件:

  • 用戶端應用。用戶直接使用的設備上的應用,如運行於瀏覽器的H5聊天應用,或者獨立的APP。
  • 路由服務。
  • 智能對話。提供問答和對話服務的應用或SAAS平臺。可以使用百度UNIT,或阿里雲的智能對話服務。(2018/5/30 阿里雲的智能對話服務最近在升級,新用戶暫時無法使用)
  • 第三方內容服務。
  • 客戶應用內容服務。
  • 客戶管控臺。客戶管理控制智能對話服務的界面。企業客戶可以在控制檯中設置意圖,訓練、測試和發佈自己的對話服務。

    以上的組件可以支撐和用戶的文本對話能力,如果要和用戶進行語音對話,還需要ASR和TTS組件。

  • ASR,Automatic Speech Recognition的簡寫,將人的語音轉換爲文本的技術。
  • TTS,Text To Speech的縮寫,將文本轉換爲人的語音。先進的TTS技術輸出的語音音律流暢,使得聽者感覺自然。

參考資料

1. https://help.aliyun.com/document_detail/64541.html

發佈了44 篇原創文章 · 獲贊 35 · 訪問量 19萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章