【文本分類】RCNN模型

原創

2020-06-21 07:34

RCNN模型也是用於文本分類的常用模型，其源論文爲Recurrent Convolutional Neural Networks for Text Classification。

模型整體結構如下：

架構主要包括如下模塊：
（1）通過雙向RNN模型，得到每個token上下文的信息（隱層輸出）：
（2）通過隱層輸出與原始embedding的拼接，得到擴展後的token信息；
（3）後面接於TextCNN的CNN、max-pooling和fc層，得到分類結果。

整個模型結構還是非常清晰的，下面給出pytorch的簡單實現:


import torch
import torch.nn as nn


Config = {"vob_size": 100,         # 字典尺寸
          "ebd_size": 50,            # 詞嵌入維度
          "hidden_size": 20,         # 字典尺寸
          "num_layer": 2,
          "bidirectiion": True,   # 雙向
          "drop":0.3,      # dropout比例
          "cnn_channel":100,   # 1D-CNN的output_channel
          "cnn_kernel": 3,    # 1D-CNN的卷積核
          "topk": 10,  # cnn的output結果取top-k
          "fc_hidden": 10,  # 全連接層的隱藏層
          "fc_cla": 4,  # 全連接層的輸出類別
          }


class LSTM_pool(nn.Module):
    def __init__(self):
        super(LSTM_pool, self).__init__()
        self.embedding = nn.Embedding(Config['vob_size'], Config['ebd_size'])
        self.lstm = nn.LSTM(
            input_size=Config['ebd_size'],
            hidden_size=Config['hidden_size'],
            num_layers=Config['num_layer'],
            bidirectional=True,
            batch_first=True,
            dropout=Config['drop']
        )

        self.cnn = nn.Sequential(
            nn.Conv1d(
                in_channels=Config['hidden_size'] * 2 + Config['ebd_size'],  # 詞向量和output維度做concat
                out_channels=Config['cnn_channel'],
                kernel_size=Config['cnn_kernel']),
            nn.BatchNorm1d(Config['cnn_channel']),
            nn.ReLU(inplace=True),

            nn.Conv1d(
                in_channels=Config['cnn_channel'],
                out_channels=Config['cnn_channel'],
                kernel_size=Config['cnn_kernel']),

            nn.BatchNorm1d(Config['cnn_channel']),
            nn.ReLU(inplace=True)

        )

        self.fc = nn.Sequential(
            nn.Linear(Config['topk'] * Config['cnn_channel'], Config['fc_hidden']),   # 2爲bidirectional的拼接結果
            nn.BatchNorm1d(Config['fc_hidden']),
            nn.ReLU(inplace=True),

            nn.Linear(Config['fc_hidden'], Config['fc_cla'])

        )

    @staticmethod
    def topk_pooling(x, k, dim):
        index = torch.topk(x, k, dim=dim)[1]
        return torch.gather(x, dim=dim, index=index)

    def forward(self, x):
        emb = self.embedding(x)
        out, _ = self.lstm(emb)    # (B, S, 2H)
        out = torch.cat([emb, out], dim=-1)   # (B, S, E) + (B, S, 2H) = (B, S, 2H+E)
        out = out.permute((0, 2, 1))    # (B, 2H+E, S)
        out = self.cnn(out)    # (B, C, S-m)
        x = self.topk_pooling(out, k=Config['topk'], dim=-1)   # sequence_len方向取top2，  (B, C, k)
        x = x.view((x.size(0), -1))    # (B, C*k)
        logits = self.fc(x)
        return logits

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【文本分類】RCNN模型

EXCEL中下拉菜單中添加新選項或者刪除選項

號稱能打敗MLP的KAN到底行不行？數學核心原理全面解析

同事使用 insert into select 遷移數據，開開心心上線，上線後被公司開除！

Git使用經驗總結5-修改提交信息

Python 爬蟲：Spring Boot 反爬蟲的成功案例

京東科技數字化營銷能力的演進與最佳實踐| 京東雲技術團隊

Git使用經驗總結4-撤回上一次本地提交

Java中止線程的方式

壓榨數據庫的真實處理速度

國內SaaS遇冷？未來企業服務賽道是否還有機會？

【字典樹】用python實現Trie樹

docker的基本使用筆記

動態規劃法求解最長上升子串問題

【Pytorch】記錄自定義DataLoader時一個易犯的隱性錯誤

自定義數據迭代器

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結