美團的各個業務有着豐富的NLP場景,而這些場景中模型的構建需要很多的標註資源,成本很高。小樣本學習致力於在數據資源稀少的情況下訓練出比較好的模型。本文從主動學習、數據增強、半監督學習、領域遷移、集成學習&自訓練幾個方向介紹了現有的一些方法,並在美團場景進行了實驗,效果上也取得了一定的提升。希望能對從事相關研究的同學有所幫助或者啓發。
作者簡介
駱穎、徐俊、謝睿、武威等,均來自美團搜索與NLP部/NLP中心。
招聘信息
美團搜索與NLP部/NLP中心是負責美團人工智能技術研發的核心團隊,使命是打造世界一流的自然語言處理核心技術和服務能力,依託NLP(自然語言處理)、Deep Learning(深度學習)、Knowledge Graph(知識圖譜)等技術,處理美團海量文本數據,爲美團各項業務提供智能的文本語義理解服務。
NLP中心長期招聘自然語言處理算法專家/機器學習算法專家,感興趣的同學可以將簡歷發送至[email protected]。
閱讀美團技術團隊更多技術文章合集
前端 | 算法 | 後端 | 數據 | 安全 | 運維 | iOS | Android | 測試
| 在公衆號菜單欄對話框回覆【2020年貨】、【2019年貨】、【2018年貨】、【2017年貨】等關鍵詞,可查看美團技術團隊歷年技術文章合集。