除了輸入法,移動端AI還有哪些想象空間?

提到端 AI,大家一定會想到手機上的鍵盤。輸入法已成爲移動端 AI 最爲成熟,也最爲有成效的應用之一。在這一領域,觸寶是最早的先行者之一。

截至目前,觸寶輸入法已擁有超過三億月活用戶,覆蓋 200 多個國家和地區以及 250 多種語言。這些成果,就是基於觸寶 AI 實驗的語言模型研究成果。在觸寶的產品線中,AI 的應用可以實現哪些功能?通過本文對觸寶 AI 實驗室高級技術總監吳琨的採訪,我們來了解一下觸寶的 AI 落地實踐,它能引發業界關於移動端 AI 的哪些思考和想象?

觸寶AI實驗室

據觸寶AI實驗室高級技術總監介紹,觸寶AI實驗室目前有20位成員構成,主要研究方向爲自然語言理解、語言模型、語音識別和深度學習和通用機器學習的應用。觸寶輸入法目前擁有超過三億月活用戶,覆蓋200多個國家和地區以及250多種語言,就是基於AI實驗的語言模型研究成果。同時,目前觸寶輸入法已經實現了自主研發的語音識別來替代第三方解決方案,爲國際用戶提供語音輸入支持。在機器學習方面,觸寶AI實驗室和加州大學伯克利分校合作建模研究營銷電話的鑑別。同時,在觸寶內部多個App中也落地了包括推薦系統、點擊率預測等項目。

移動端AI平臺架構和迭代

觸寶移動端的AI由深度學習語言模型爲核心,配以NGRAM模型做輔助,同時也加入了很多多年積累的專家規則,可以說,這個架構包含了NLP歷史發展的三個階段的經典經驗:規則、統計、神經網絡。這樣可以進行優勢互補,達到體驗最優:規則可以覆蓋很少一部分重要的體驗,同時計算代價低,而神經網絡可以用較高計算代價獲得最好的預測性能,最後NGRAM則是一種投入產出的折中。

吳琨介紹道,觸寶移動端最初的AI應用是輸入法內核,在終端進行語言模型的計算。

之後,第一次迭代是發生在2012-2014年,觸寶開始構建自己的大數據計算平臺,產生了騷擾電話號碼識別等應用。

第二次迭代是在2015-2017年,觸寶構建自己的廣告變現平臺和推薦系統,開始內容生態建設和商業化變現。

第三次迭代是2017年之後,觸寶將所有的數據打通,統一處理,構建用戶管理平臺,對多產品、全用戶生命週期的數據進行分析建模,來降低運營成本,提高變現效率。在產品方面則構建了更爲成熟的內容分發系統,對多個垂直品類的APP進行用戶內容個性化支持。

技術實現和應用

首先是關於深度學習框架的選用,觸寶選用的是谷歌的Tensorflow框架,包括終端計算也是Tensorflow Lite,主要原因是觸寶和谷歌保持多年良好的合作關係,通常能夠有渠道一起反饋和改進技術上的問題,也能夠及時體驗和應用谷歌新的技術。例如,針對Tensorflow Lite在移動端的應用,觸寶就和Google在其中文社區中進行了文章分享。同時觸寶也認爲在移動端,谷歌的計算框架還是有發展優勢和前景的。

AI在輸入法中的應用

事實上,將AI應用於輸入法中已經不是一個新鮮的做法了,很多輸入法中都採用了最先進的AI技術,如訊飛輸入法、百度輸入法等。那麼,在觸寶輸入法中,AI的應用有何特別之處呢?

首先是語言模型的AI化,觸寶使用深度學習進行模型訓練。其次是在數據處理的過程中運用AI技術來進行語料處理,例如語言檢測、實體識別、新詞發現和髒詞過濾等。觸寶根據不同類型的反饋來不斷改進系統,這些反饋包括包括用戶行爲、用戶評論、語料更新等。

內容產品應用

在觸寶的內容產品中,AI技術也得到了落地。吳琨表示,觸寶的產品研發全線都有AI技術參與。在所謂海盜指標AARRR(獲客、激活、留存、營收、推薦)的全過程,觸寶都使用大數據和機器學習對產品和用戶進行建模,來指導生產、營銷、推廣等過程。其效果比較理想,使得觸寶的營收增長和毛利都在行業中處於領先位置,這個從我們的財報中就可以看出。

觸寶2018年Q4財報顯示,受惠於內容系列產品的顯著增長,觸寶四季度淨收入同比增長147%達4705萬美元,2018全年淨收入同比增長259%至1.34億美元;四季度及全年的淨利潤分別爲408萬美元及1039萬美元,去年同期淨虧損則分別爲225萬美元和2366萬美元;四季度及全年經調整的淨利潤分別爲489萬美元和1275萬美元。

觸寶創始人兼董事長張瞰表示:“我們對公司在2018年第四季度的業務進展感到振奮。2018年我們實現了重要的里程碑目標。內容系列產品的DAU快速增長,證明了公司致力於成爲人工智能驅動的全球內容分發平臺的戰略是成功的。”

智能助手Talia:支持國內市場還需要時間

據媒體報道,觸寶的智能助手Talia只面向印度市場,但據吳琨介紹,Talia並不僅服務於印度市場。Talia通過觸寶的廠商合作伙伴,率先搭載在向印度地區發貨的智能手機裏,而在在線渠道,Talia已經支持了幾十個國家和地區。觸寶一直極爲重視國內市場,不過目前Talia的各項功能需要和供應商對接,所以在業務層面,支持國內市場還需要一個過程。

據悉,Talia具有情景感知、沉浸式體驗和 AI 主動推薦三個賣點,這三個功能的具體實現技術是怎樣的呢?

Talia的核心技術與自然語言理解相關。首先是需要對用戶的輸入進行意圖識別和實體識別,然後再將輸入結構化,派發給相關的後端服務,通過後端計算後返回結構化結果呈現給用戶。但難點在於用戶並不直接和機器人交互,而需要Talia在用戶自然輸入過程中理解用戶意圖,所以對模型分類準確率要求較高。同時,這也需要研發人員針對不同場景進行服務範圍的歸類和壓縮,間接從產品設計上提升識別準確率。

未來規劃:聚焦於NLP

從最早的觸寶輸入法開始,觸寶一直以來都在AI的第一線進行實踐和探索。目前從短期來說,觸寶將優先落地對業務目標有幫助的AI項目,例如對用戶生命週期的預測和分析、用戶行爲的建模預測、輸入法全語言的AI化以及將AI能力在B端進行輸出等。

長期來說,觸寶將在AI方面持續投入,因爲觸寶看好AI這個科技領域的長期發展,觸寶的AI重心仍然將在自然語言領域,將會結合自己的產品、數據,加大對包括語音、語義等方面的基礎研究,並將其成果應用到產品和服務中去。

趨勢展望

關於智能終端設備

相信擁有一臺真正可以依賴、可以幫助我們處理日常任務的智能終端設備是每一個人的夢想,這也是很多企業的產品目標。那麼在吳琨看來,在未來,智能終端設備會是什麼樣的?出現哪些發展趨勢呢?

在吳琨看來,智能終端設備可以分爲這麼幾類,第一類是IoT(物聯網)設備,這些設備的特點是可以連入小範圍的局域網,然後通過某個中央樞紐節點路由到廣域網。IoT的設備只需要完成一些簡單交互和功能,所以終端運算能力、存儲能力和智能程度比較低,交互方式應該以簡單語音指令爲主。

第二類是特定領域的智能設備,如服務機器人、智能音箱等。這類設備一般都有觸屏,所以需要有更爲複雜的交互,除了語音識別外,還需要對話管理、語義理解、圖像識別方面的技術應用。所以,對軟硬件的要求也會比較高,需要終端有較強的運算能力。

第三類是平臺化的智能服務加上具有中等運算能力的終端設備。例如將大型遊戲的運算從終端轉移到雲端,然後將數據傳回終端。這類終端也需要承擔部分運算以便彌補網絡設施帶來的延遲,但相對來說,會比IoT要更爲強大。

關於人機交互

真正的人機交互的話題更多的是哲學層面的。如果要實現人和人一樣的人機交互,那麼看起來通用人工智能是必不可少的前提。

目前學術界有諸多觀點,吳琨比較看好的是三個條件:第一是比目前數據量更大、全且完整的海量無結構數據;第二是比目前計算能力強得多的計算機;第三是比目前網絡結構更爲複雜但通用的更趨近於人腦的神經網絡。然後我們就可以嘗試去讓計算機從數據中自己發現知識、學習知識。不過,目前這些條件都不滿足。因此,我們還是應該腳踏實地,從具體業務、需求出發,走出一條AI實踐、AI落地的路,從許許多多這樣的路中,總結歸納出更好的方法論,爲實現遠期目標做有效積累。

機器學習將向終端轉移?

近年來,機器學習特別是深度學習的模型推演,逐漸出現了從雲端向終端遷移的趨勢。但終端機器學習取代雲端機器學習會成爲未來的趨勢嗎?

吳琨認爲,出現這一現象主要有這幾個原因:首先是終端硬件計算能力的提升,特別是專門用於神經網絡計算的AI芯片逐漸成爲中高端設備的標配。第二是行業對數據保護和用戶隱私的重視,使得非必要數據可以不必通過上傳到服務器就能服務用戶。第三是終端計算可以規避網絡延遲和無網弱網情況,使得服務的體驗更好。第四是科技的發展使得AI工程技術人員能夠更有效的利用數據來達到同樣的服務效果,使得終端計算的可行性也進一步提高。

但吳琨認爲,儘管如此,終端機器學習未必會取代雲端計算成爲主流。因爲兩者的場景和特點不盡相同。在對數據規模大、模型複雜,同時對模型效果要求高的場景,還是需要雲端來支持。所以應該會出現計算資源劃分更合理,雲端計算和終端計算各得其所的局面。

採訪嘉賓介紹:

吳琨:CooTek AI Lab Senior Director

2010年加入觸寶(CooTek),現任觸寶AI實驗室高級技術總監,具有超過9年移動互聯網出海經驗,參與落地多款針對移動終端用戶的人工智能、機器學習、自然語言相關產品,涉及語言模型、用戶畫像、推薦系統、文本生成等技術領域。

吳琨老師將在7月深圳ArchSummit架構師峯會上分享更多輸入法技術細節。此外,會上還將涵蓋騰訊機器翻譯技術、Google AI產品研發、阿里對話機器人構建、支付寶輿情監控智能化等話題,乾貨滿滿。

image

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章