滴滴開源DELTA:AI開發者可輕鬆訓練自然語言模型

8月2日消息,自然語言處理領域頂級會議ACL2019在意大利弗洛倫薩繼續召開。會上滴滴正式宣佈開源基於深度學習的語音和自然語言理解模型訓練平臺DELTA,以進一步幫助AI開發者創建、部署自然語言處理和語音模型,構建高效的解決方案,助力NLP應用更好落地。

DELTA是滴滴第22個開源項目。自然語言處理模型和語音模型是很多AI系統與用戶交互的接口,此次滴滴正式這一開源深度學習模型訓練框架,旨在進一步降低開發者創建、部署自然語言處理系統和語音模型的難度。

clipboard.png
滴滴自然語言處理首席科學家Kevin Knight在ACL2019現場

DELTA主要基於TensorFlow構建,能同時支持NLP(自然語言處理)和語音任務及數值型特徵的訓練。整合了包括文本分類、命名實體識別、自然語言推理、問答、序列到序列文本生成、語音識別、說話人驗證、語音情感識別等重要算法模型,形成一致的代碼組織架構,整體包裝統一接口。

用戶準備好模型訓練數據,並指定好配置Configuration,模型訓練pipeline可以根據配置進行數據處理,並選擇相應的任務和模型,進行模型訓練。在訓練結束之後,自動生成模型文件保存。該模型文件形成統一接口,可以直接上線使用,快速產品化,能讓從研究到生產變得更容易。

clipboard.png

值得注意的是,除可支持多種模型的訓練,DELTA還支持靈活配置,開發者可基於DELTA搭建成多達幾十種的複雜的模型;此外,DELTA在多種常用任務上提供了穩定高效的benchmark,用戶可以簡單快速的復現論文中的模型的結果,同時也可以在此基礎上擴展新的模型。在模型構建完成後,用戶可以使用DELTA的部署流程工具,迅速完成模型上線。從論文到產品部署無縫銜接。

目前AI開發者可登陸Github(https://github.com/didi/delta...,利用DELTA加快實驗進度,部署用於文本分類、命名實體識別、自然語言推理、問答、序列到序列文本生成、語音識別、說話人驗證、語音情感識別等任務的系統。用戶亦可在滴滴的開源平臺上(https://didi.github.io/)獲取更多滴滴開源項目的相關信息。

實際上,NLP和語音技術在滴滴已經有廣泛的應用。通過大量應用了包括自然語言處理、深度學習、知識圖譜、語音、推薦等技術,滴滴自建了基於AI的智能客服系統,能利用人工智能技術輔助人工客服,提高人工客服處理問題的效率,並減少人工客服在重複、簡單問題上的處理量。此外,基於語音識別以及自然語言理解技術,滴滴也在構建駕駛員語音助手,日本和澳洲的滴滴司機即將能用語音直接“免接觸”接單。而在未來,這一語音助手也將支持全方位的語音交互服務,包括影音娛樂、信息查詢、車內環境調節,到乘客通信、客服,甚至是加油、充電或維保服務。與此同時,滴滴也在積極推進相關能力的開放,通過提供一站式自然語言處理工具、一站式機器人開放平臺,幫助行業合作伙伴更好地實現AI應用落地。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章