人機語音對話技術在58同城的應用實踐

導讀:本文將介紹58同城人機語音對話機器人的完整解決方案,重點分享對話策略管理、自動電話撥打、意圖識別、防騷擾控制等核心模塊的設計實現,並闡述如何將語音機器人應用於58各業務場景,以助力銷售、運營和客服提高人效。

——背景——

58同城是中國最大的生活信息服務平臺,公司主營業務包括:招聘、汽車、金融、本地服務、二手等。其中,電話溝通是信息連接的重要渠道之一,如招聘業務模塊,需要大量的業務人員進行求職信息確認、面試預約、面試回訪等重複耗時的溝通工作。爲了更好的服務 B 端商家和 C 端用戶,實現“讓生活簡單美好”的公司使命,我們開發了語音機器人來進行電話語音溝通,減少業務人員的工作量並提升服務質量。

傳統的溝通工作是完全依賴於人工撥打電話,而人工的方式相比於語音機器人存在很多問題。下圖是語音機器人與人工的對比情況:

其中,關於工作態度,人工難以保持自身情緒的長久穩定,而機器人則可以始終如一的保持穩定、情緒飽滿的工作態度;另外,在成本費用上,長期來看,語音機器人的成本遠低於人力成本。對比了市面的語音機器人後,爲了能快速的根據需求場景的變化與解決個性化的業務問題,公司採取了自研語音機器人的戰略。

下面我們看一下58同城的人機語音對話示例:

從圖中可以看出,語音機器人還是保持了相對流暢的對話。機器人怎樣實現根據用戶的不同迴應做出不同的響應的呢?後面給大家做進一步的詳細的介紹。

——語音機器人的總體架構——

1. 總體架構

語音機器人的總體架構 :

① 接入層:主要以 API 接口的形式,方便業務方調用語音機器人。當一通電話結束時,機器人可以把消息以 WMB 方式傳遞給業務方,相當於異步調用。同時銷售等業務方,可以通過結果回傳接口將後期跟進、成單信息反饋給後臺,進行進一步的算法優化。

② web 管理層:主要負責話術的配置、權限的控制、批量撥打、防騷擾策略設置、數據可視化查詢等。

③ 邏輯層:整個機器人的核心控制層,相當於人的大腦,保證整個對話流程完整進行。

④ 編輯運營層:目前主要用於數據標註,標註數據用於模型迭代與線上效果評估。

⑤ 基礎服務層:主要包括 SIP 電話資源和語音識別/合成接口兩部分。SIP 電話資源即實現撥打電話的資源,像東信、漫道等。語音識別採用的是阿里、騰訊等第三方的接口。

2. 智能外呼流程

語音機器人智能外呼流程主要分爲通話前、通話中、通話後三個部分。通話前主要是調用端,調用端會把被叫號碼、業務場景等使用的信息傳給主體外呼,主體外呼拿到信息後會進行一些策略的設置,如防騷擾邏輯的設置、選擇合理的 SIP 方、建立 SIP 通信、根據業務場景加載話術等。當觸發開場白後,進入“通話中”狀態,通過發送語音和利用第三方語音合成接口編碼語音,經 SIP Proxy Sever 端發送給用戶,用戶接聽後,再對用戶的反應進行判別與用戶語音的解碼,再利用第三方的流式語音識別接口得到文本。通過對文本的分析,結合話術跳轉的邏輯,對用戶的回覆進行合理的響應。通話結束後,語音機器人會對整輪電話進行通話狀態判斷、整輪通話意圖識別、數據存儲與回調,並以 WMB 的方式回傳給業務方。

——核心功能——

58同城語音機器人的核心功能包括四部分:電話撥打服務、通話狀態識別、智能對話交互、整輪意圖識別。

1. 電話撥打服務

實現電話的撥打服務功能,和客戶建立連接。

當前這一功能實現主要是基於 JAIN SIP 的開源庫,主要包括四層。其中在資源管理層控制上,對於呼叫用戶會考慮同樣的歸屬地來提升撥打電話的接通率。對話建立層基於 SIP 協議來實現建立通話連接與釋放連接的處理。

防騷擾策略

爲了避免過多打擾和消耗用戶,設計了防騷擾策略。其策略主要考慮:

① 被呼名單限制:設置了呼叫白名單與黑名單,比如有些特定用戶名單是不能呼叫的。

② 呼叫時間控制:哪些時間段是不能呼叫的。

③ 呼叫頻次控制:對用戶的呼叫頻率要控制,防止過渡消耗用戶。

④ 用戶情緒識別:對呼叫中用戶的情緒進行分析,當用戶情緒很牴觸時,添加到被禁的黑名單中。

2. 通話狀態識別

判斷拿到的客戶電號碼話是否真實存在和是否處於正常狀態。比如做銷售業務時,需要覈對業務方拿過來的客戶號碼是否是空號、異常號碼等,這個可用通過電話撥打服務來實現狀態判斷。

具體可以利用 SIP 協議和響鈴語音來實現。SIP 協議:利用基於 SIP 協議返回的 SIP 狀態碼來進行判斷,比如返回603則判斷爲空號;響鈴語音:通過將語音信號轉化爲文本,進行文本關鍵詞匹配和文本分類,對撥打號碼進行判斷,比如“您撥打的電話已關機”判斷爲關機狀態,還可以利用語音信息特徵設計響鈴語音分類器,判斷號碼狀態。

3. 智能對話交互

爲了實現多輪對話流暢進行,智能對話交互主要包含以下模塊:智能對話管理、電話按鍵捕獲、單句意圖識別、標準問題匹配、槽位提取。

① 智能對話管理

通常情況下:將用戶語音轉化後的文本作爲模型的輸入,首先對文本進行包括單句意圖識別與槽位識別的 NLU 工作,然後將信息轉化爲用戶動作並交給對話管理器。對話管理器需要判別用戶的意圖,根據預先設計好的話術庫,結合映射策略進行話術選擇跳轉,生成系統動作。

具體的話術選擇與策略,可以根據用戶動作的語音響應與非語音響應,做進一步的處理,如下圖所示。

對於四類具體話術策略跳轉的理解,可以結合下圖話術實例來看:

② 電話按鍵獲取

捕獲用戶的按鍵信息。電話按鍵信息的捕獲主要是基於 RTP、SIP、SDP 協議對按鍵的信號解析獲得。

③ 單句意圖識別

用戶的意圖可能會有很多種,我們將意圖整體劃分爲了十九類意圖,並建立了標籤、意圖及說明的識別表。

單句意圖識別的實現:當前公司上線主要用的是 TextCNN 進行多分類,將用戶的單句話轉換爲文本後再進行分類。

我們也在嘗試使用 Bert 模型,進行單句意圖識別:

用公司自己的場景語料在谷歌官方中文預訓練模型的基礎上進行的 Pretrain,拿到 Bert 關於句子的編碼向量 CLS 加全連接層後接 softmax 進行多分類。相對於原來 TextCNN 的方式,效果上準確率會有百分之二的提升。

④ 標準問題匹配

當用戶意圖爲提問時,對於問題類型爲標準型問題,可以與標準問題庫的問題進行問題匹配,選擇對應的答案進行回覆。

標準問題匹配當前使用的主要模型是 Bi-LSTM-DSSM:

Bi-LSTM 進行句子的語義編碼,DSSM 進行句子匹配。在正負例的選擇上,當前主要需要依據具體場景與實驗效果進行設定。計算損失時的目標是與正例的相似度越高以及與負例的相似度越低。

在標準問題匹配上,也有嘗試用 Bert 的方式來做:

在標準問題的匹配上,Bert 主要是用於句子信息的抽取,在具體實現的時候,對比了 CLS、Mean-Pool、Max-Pool 等常見方式,發現用 Max-Pool 的方式去抽取作爲句子的向量表示是最好的。

標準問題挖掘

完善和更新標準問答數據集。

從對話數據中,提取問題與更新問答知識庫。這裏在新增問題時需要結合人工進行問題入庫與否的審覈,對於確定後的標準問題,需要對答案填充後才能添加到問答知識庫中。

⑤ 槽位提取

提取對話文本中的詞槽,當前主要使用的是 IDCNN+CRF 的方式進行。

當前外呼中提取的詞槽實例如下:

4. 整輪意圖識別

在部分外呼業務場景下,當外呼電話結束時,需要對客戶意圖進行預測,目前採用整輪意圖識別的方式對客戶意圖進行預測。比如在銷售場景下,將客戶的意圖分成了三類分別爲 SUCCESS、CENTRAL、REFUSED,具體意圖說明如下表:

整輪意圖識別會考慮整個對話從響鈴識別到對話結束的相關信息來判定,具體可以見下圖:

具體的意圖識別算法,主要包括 TextCNN 等模型進行分類,輸入爲整個對話過程中用戶的所有回覆文本的拼接,當前實際上線的模型是採用多模型融合來做的。此處以 TextCNN 單模型爲例,模型結構如下圖:

意圖識別的評測:

評測會包括離線人工評價與線上評價。

目前影響意圖識別準確率的主要因素是語音識別錯誤。

——應用場景——

語音機器人的實用場景不僅在是在銷售場景,在58同城的應用主要還可以概括六個方面,包括:

① 通知:最基本的場景,如當用戶信息發生更改,機器人可以用語音的方式告知用戶哪些信息發生了更改,需要注意哪些特別事情等。

② 滿意度回訪:如使用58同城的產品時,可以利用語音機器人對客戶進行產品滿意度的回訪。

③ 信息驗真:進行用戶信息真實與否的確認。

④ 銷售:判斷與發現潛在客戶。

⑤ 告警:比如內部運維場景下,服務器出現了異常情況,機器人語音電話將報警信息告訴相關負責人。

⑥ 銷售客服培訓:在人力客服上崗前,需要先進行上崗培訓,原來主管對於新員工的基礎培訓與考覈部分,可以改爲利用機器人進行初步培訓。

下面可以看看四個具體的實際應用案例:

① 校招提效:通知場景,語音機器人在校招面試中成功運用,提升校招工作人員的效率。

② 客服提效

③ 運營提效

④ 銷售提效

利用語音機器人識別意向程度高的潛在客戶,提升銷售人員的銷售效率。

小結:語音對話技術不僅在銷售業務領域落地,在信息通知、內部的業務告警等多個業務模塊都得到了應用。本文圍繞人機語音對話技術在58同城的落地場景,對語音機器人的總體架構、核心功能、具體實踐場景進行了系統的介紹。

作者介紹

李忠

58同城 | AI Lab 算法架構師

本文來自 DataFun 社區

原文鏈接

https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247495417&idx=1&sn=dba2868cbc9b7234029a9e0afccdaee4&chksm=fbd75c95cca0d583de37a3e588a2d47099b76d9bbf9e2e5990e6cfdb0e8a91a3eaf884791114&scene=27#wechat_redirect

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章