論文筆記（NLP）——Convolutional Neural Networks for Sentence Classification

原創

2020-05-25 23:53

abstract
本篇論文報告了一系列用預訓練詞向量上訓練的CNN進行句子級分類任務的實驗。展示了有少量參數調整和靜態向量的簡單的CNN在多個基準上達到了很好的效果。通過微調學習特定任務的向量能夠進一步提高性能。另外本篇論文對結構進行簡單的修改以允許使用特定任務和靜態向量。本文討論的CNN提高了7個任務中的4個技術，包括情感分析和問題分類。
model

如圖所示，句子中的每個詞都被轉換爲 $k$ 維的向量 $x_i$ ，如果句子的長度爲 $n$ ，則該句子被表示爲 $n\times k$ 維的詞向量矩陣每個卷及操作都涉及一個filter $w∈R^{hk}$ 產生一個新的特徵。filter應用在每一個句子中單詞的每一個窗口產生一個feature map最後通過max pooling從feature map中抽取最重要的feature。本文采用多個filters抽取多個features。
本文在詞向量的兩個channel上進行試驗，一個在通過訓練中始終保持靜態，一個通過反向傳播進行微調。
在前向傳播過程中，使用masking向量 $r$ 進行dropout。
在測試階段，以概率 $p$ 對權重進行縮放。
Datasets and Experimental Setup
3.1 Hyperparameters

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.