讀TextRCNN文章

原創

2020-04-28 20:31

TextRCNN 顧名思義，對文本處理包含RNN 和 CNN的元素，其中CNN部分是用到了池化，RNN部分是考慮了上下文的因素

1.模型結構

RNN 部分：

具體公式如下：

非線性激活部分：

maxpooling部分

y(3) 和 y(2) 的長度是一樣的

全連接層

Softmax

2. 試驗的一些設置

看下參數部分：

3. 幾種比對的模型

Bag of Words/Bigrams + LR/SVM

Average Embedding + LR

LDA

Tree Kernels

RecursiveNN

CNN ，

cnn , rnn , rcnn 的效果比傳統機器學習的方法的要更出色，在所有的4份數據集上，神經網絡能更好的捕獲上下文的信息
cnn 和 crnn 跟 rnn 比較的話，cnn 和 rcnn 效果更好，認爲主要的原因是 cnn可以通過池化選擇更顯著的特徵，通過卷積層捕獲上下文的信息，二RNN智能捕獲上下文信息，依賴於模型的結構
在ACL 和 SST 數據集上，RCCN表現更好
比對RCNN 和 CNN，發現RCNN在所有的case中，表現更好，認爲主要的用RNN的結構比CNN用滑窗口的結果下更好，

上下文信息捕獲上：

比對RCNN 和CNN，其中CNN採用固定的滑窗的方式，窗口的大小有一些影響，一個比較小的窗口，會損失距離較遠的信息，太大會導致數據稀疏的問題，另外，大量的參數也更難訓練。

refer：Recurrent Convolutional Neural Networks for Text Classification

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.