台部落rageidencenovy

TINYBERT: DISTILLING BERT FOR NATURAL LANGUAGE UNDERSTANDING 來源：ICLR 2020 在審鏈接：https://arxiv.org/pdf/1909.10351

2020-06-16 02:21:35

論文地址：https://arxiv.org/pdf/1911.03829.pdf 除了翻譯之外，對大部分的序列到序列任務，其目標句子和源句子高度重合，比如句子複述、文本摘要、語法糾錯等等。因此，有時候不必從頭開始生成文本，而是基

2020-05-23 15:10:19

Mask-Predict: Parallel Decoding of Conditional Masked Language Models 來源：EMNLP2019 鏈接：https://arxiv.org/pdf/1904

2020-02-21 07:10:45

Combating Adversarial Misspellings with Robust Word Recognition 來源：ACL2019 鏈接： https://arxiv.org/pdf/1905.11268

2020-02-21 07:10:44

NLPTEA-2017 CGED比賽第一名 1.Alibaba at IJCNLP-2017 Task 1: Embedding Grammatical Features into LSTMs for Chinese Grammatica

2018-11-04 07:34:15

中文語法糾錯（最近三年）： 1.Alibaba at IJCNLP-2017 Task 1: Embedding Grammatical Features into LSTMs for Chinese Grammatical Error

2018-10-27 07:09:53

2018-08-22 18:41:46

2018-08-22 18:41:46

缺失值處理：刪除記錄，數據插補，不處理數據插補：1.根據屬性值的類型，用該屬性值的平均數、中位數、衆數進行插補2.將缺失值的屬性值用用一個固定值表示3.在記錄中找到與缺失樣本最接近的樣本的屬性值4.用機器學習的方法預測缺失值5.插值法：利

2018-08-22 18:41:46

2018-08-22 18:41:46

2018-08-22 18:41:45

主動學習（Active learning）：主動學習也是一種監督學習與傳統監督學習不同的是，傳統監督學習直接利用外界提供的已標註樣例進行訓練，即訓練集合由已標註樣例構成而主動學習則主動選擇所需要的樣例，從大量無類別樣例中挑選認爲最有

2018-08-22 18:41:45

2018-08-22 18:41:45

2018-08-22 18:41:45

摘自 https://zhuanlan.zhihu.com/p/21441807 深度學習大講堂在經典的機器學習問題中，我們往往假設訓練集和測試集分佈一致，在訓練集上訓練模型，在測試集上測試。然而在實際問題中，測試場景往往非可控，測

2018-08-22 18:41:45