小樣本學習及其在美團場景中的應用

原創

2021-08-20 21:17

美團的各個業務有着豐富的NLP場景，而這些場景中模型的構建需要很多的標註資源，成本很高。小樣本學習致力於在數據資源稀少的情況下訓練出比較好的模型。本文從主動學習、數據增強、半監督學習、領域遷移、集成學習&自訓練幾個方向介紹了現有的一些方法，並在美團場景進行了實驗，效果上也取得了一定的提升。希望能對從事相關研究的同學有所幫助或者啓發。

作者簡介

駱穎、徐俊、謝睿、武威等，均來自美團搜索與NLP部/NLP中心。

招聘信息

美團搜索與NLP部/NLP中心是負責美團人工智能技術研發的核心團隊，使命是打造世界一流的自然語言處理核心技術和服務能力，依託NLP（自然語言處理）、Deep Learning（深度學習）、Knowledge Graph（知識圖譜）等技術，處理美團海量文本數據，爲美團各項業務提供智能的文本語義理解服務。

NLP中心長期招聘自然語言處理算法專家/機器學習算法專家，感興趣的同學可以將簡歷發送至[email protected]。

閱讀美團技術團隊更多技術文章合集

前端 | 算法 | 後端 | 數據 | 安全 | 運維 | iOS | Android | 測試

| 在公衆號菜單欄對話框回覆【2020年貨】、【2019年貨】、【2018年貨】、【2017年貨】等關鍵詞，可查看美團技術團隊歷年技術文章合集。

| 本文系美團技術團隊出品，著作權歸屬美團。歡迎出於分享和交流等非商業目的轉載或使用本文內容，敬請註明“內容轉載自美團技術團隊”。本文未經許可，不得進行商業性轉載或者使用。任何商用行爲，請發送郵件至[email protected]申請授權。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

小樣本學習及其在美團場景中的應用

作者簡介

招聘信息

解決報錯pip：urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool

從零開始學架構V2-架構設計流程-2

從零開始學架構V2-初識架構設計-1

高德地圖爬蟲實踐：Java多線程併發處理策略

京東廣告研發——效率爲王：廣告統一檢索平臺實踐

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結