桔妹導讀:13年以後,以外賣、網約車、房產銷售爲主的O2O平臺,極大的改變了社會的運行模式。相比前一代互聯網公司,這一代互聯網公司都面臨着人與人的線下交互,因此在體驗、治理上也帶來了新的挑戰。在滴滴,經過多年的耕耘,我們探索了一套功能強大的治理算法系統,圍繞司乘體驗提升的核心目標進行了全方位的探索和落地。
其中,按照治理對象,分成訂單維度治理、人維度治理。
訂單維度治理,主要指在訂單全生命週期中,在異常發生前、發生初、發生時、發生後,平臺的治理行爲。
-
人維度治理,指在司機、乘客在平臺的全生命週期中的綜合治理行爲,主要的抓手是司機服務分、教育、管控的一整套方案。
考慮到體驗異常相關因素較多,相對比較高頻,訂單維度治理的應用相對更廣,挑戰也更大。本文討論的治理算法主要針對該部分。
治理算法,作爲O2O背景下新的算法方向,有如下的挑戰。
第三個挑戰則是多模態特徵。通過完備的場景還原能力來做干預、判責等,需要用到訂單、時空、司乘統計特徵之外,也要參考司乘的溝通信息(比如司乘是否指路)、協商投訴文本(各自的表述)、以及桔視特徵(比如多人分段上下車等)。是否能高效、綜合的利用更多的多媒體信息,對工程、算法而言都是巨大的挑戰。
3.
糾紛發生前與發生初的降發生方案,比如當司機提前計費時,觸發實時干預等;
糾紛發生時的智能受理方案,如在司機賬單發送時刻,平臺精準識別未坐車收費問題訂單,智能觸發司乘協商流程,能幫助乘客主動解決糾紛問題;
糾紛發生後的管控判責和補償方案。通過建設智能判責能力,能落地如服務分扣除、補款、罰款等方案,對糾紛問題做合理的調解與治理。
成熟的在線服務引擎。其中策略流程引擎有效支持了策略流程的可視化配置管理;模型引擎有效支持了LR、XGB、DNN等一系列模型的在線部署與預測服務;規則引擎通過在線解析基於DSL的規則描述語言,有效降低了策略規則的迭代成本。
策略基礎能力庫。沉澱了一套字、詞、句等多粒度的文本算法工具箱,拓展了治理算法的技術空間與業務價值。同時建設了離線策略數據倉庫,實現業務數據、鏈路數據、策略數據的體系化治理與整合。爲業務落地與策略迭代提供了高質量、高可用的數據。
在線與離線相結合的標註工作臺,承載了滴滴治理算法的標註需求。策略RD離 線灌入抽樣樣本,質檢標註團隊在線標註做單,保障了模型樣本的大規模與高質量產出。通過T+1模型更新系統,引入模型自動化更新機制,解決了在線模型的效果衰退問題。
▍
4.1 小樣本學習
step1 用已有的標籤數據作爲初始訓練集,訓練得到一個初始分類器模型;
step2 利用初始分類器模型,對剩下的還未標記的數據打標籤,選出高置信度的樣本加入已有標籤數據集中,從而擴充訓練樣本集;
step3 根據新的訓練樣本集訓練新的分類器。重複step1~step2直到滿足預設停止條件(如樣本量達到預期量級等)
-
優化點1:採用ESMM結構。ESMM模型結構恰好適配於攔截的業務場景。該優化點一定程度上解決樣本偏差問題;實現MTL結構。 -
優化點2: 連續特徵離散化,離散特徵embedding。該優化點從數據特徵工程層面優化,來提升模型的性能。特徵離散化有利於NN模型的迭代和性能的提升,通過卡方分箱將訂單特徵中的連續形特徵離散化;同時將原始的離散特徵與分箱後的離散特徵進行多特徵域的embedding
優化點3:多模型融合,融合行程中錄音ASR特徵的指路語義特徵。該優化點加入場景強特徵,進一步提升模型效果。具體操作方法是:行程中錄音能夠有效地識別指路等行爲,將ASR文本特徵訓練的指路模型的中間向量輸出作爲繞路攔截模型的輸入。
實驗結果證明,多任務學習的方式能夠有效地學習到投訴任務的特點,更好地輔助有責任務的學習,效果遠優於單任務的模型。通過輔助任務的引入緩解了標註樣本較少的問題,在策略生效點ESMM新模型的召回提升較爲顯著:相比線上的xgb模型,準確率提升0.6pp,召回率顯著提升4.2pp;相比硬共享的多任務學習準確率提升0.2pp,召回率提升1.1pp。後續的A/B實驗中取得了不錯的線上業務效果。
在滴滴平臺上,滴滴智能安全車載設備桔視已經覆蓋超過50%的網約車訂單,另外每個司機的手機都在進行全程的行程中錄音,再配合全流程的軌跡信息,整體在場景還原上提供了非常豐富的多媒體能力。而多模態特徵的應用,有通過端到端的框架聯合訓練、以及通過設計兩階段模型來應用的兩種方案。
▍ 5.3 流式特徵探索
在特徵形態上,我們基於線上的流式數據,如行程中的軌跡流、錄音流、視頻流等數據做了一些流式語義特徵的挖掘。這裏主要介紹軌跡流相關的技術方案。
軌跡信息的提取和利用對於糾紛治理業務有較大的價值,而目前對於軌跡信息的處理侷限於提取距離差、速度等簡單特徵,信息損失大,故需探索軌跡的價值。
技術選型主要分爲兩大類:無監督(自監督)的表示學習方案和有監督的子網絡嵌入方式。我們的實驗探索主要基於後者展開。
有監督的子網絡嵌入方案的建模流程如下。序列模型部分,我們主要嘗試了主流的LSTM模型,整體模型AUC效果上:Bi-LSTM > Vanilla-LSTM > Stacked-LSTM。
6.
總結
治理算法是一個全新的領域,是隨着O2O平臺興起以來,在線上線下治理、管控需求下新起的一個策略算法方向。在過去的幾年,團隊在NPS、CPO等公司核心關注的體驗指標上,都取得了很好的業務收益;在技術體系上也有了相對深入的積累。
團隊招聘
▬
團隊目前熱招高級Java工程師、go後端研發工程師等技術崗位中,歡迎有興趣的小夥伴加入,可投遞簡歷至 [email protected],郵件請郵件主題請命名爲「姓名-投遞崗位-投遞團隊」。
掃碼瞭解更多崗位
作者
▬
內容編輯 | Hokka
聯繫我們 | [email protected]
本文分享自微信公衆號 - 滴滴技術(didi_tech)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。