ABCNN

原創

2018-09-03 17:32

昨天和师兄聊了一下对attention的理解
其实相似性矩阵本身并不是模型的参数，是参数的只是后面的dense layers；

看了好久才弄懂ABCNN的卷积过程。
其实卷积也还是就是Yoon Kim的方法。
协助理解的时候，这篇讲的还是很好的：

https://blog.csdn.net/liuchonge/article/details/69587681

后面这里提了一下，说把中间pooling层的输出也合并到最后的输出里，可以增强performance，但是实测效果却一般。感觉原因还是：
基于Yoon Kim的方法的话，第二层卷积的输入本身就是各个kernel输出的结果了，再卷积就没有提取局部特征的解释性了。

以下是ABCNN_1的过程：

输入的时候是两个句子

a = [{\bar{a}}_{1}, {\bar{a}}_{2}, . . ., {\bar{a}}_{m}] b = [{\bar{b}}_{1}, {\bar{b}}_{2}, . . ., {\bar{b}}_{n}]

首先计算一个相似度矩阵

A_{i, j} = m a t c h s c o r e ({\bar{a}}_{i}, {\bar{b}}_{j})

{\bar{a}}_{i}, {\bar{b}}_{j}

表示对应的词向量

m a t c h s c o r e

则是

1 / (1 + | x - y |)

，其中

| x - y |

是欧氏距离

那么其实现在

a \in R^{d * m} b \in R^{d * n} A \in R^{m * n}

接下来，我们可以得到

F_{a} = W_{a} \dot{} A^{T} F_{b} = W_{b} \dot{} A

其中：

W_{a} \in R^{d * n}; F_{a} \in R^{d * m} W_{b} \in R^{d * m}; F_{b} \in R^{d * n}

然后将 $a, F_{a}$ 看成句子的两个channels输入到CNN中，做卷积
channel的作用其实可以看这里：
https://blog.csdn.net/sscc_learning/article/details/79814146
这样其实就是卷积核的维度也要增加一维。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

word2vec 过程理解&词向量的获取

網上有很多這方面的資源，詳細各位都能夠對於word2vec瞭解了大概，這裏只講講個人的理解，目的：通過對於一個神經網絡的訓練，得到每個詞對應的一個向量表達基於：這個神經網絡，是基於語言模型，即給定T個詞的字符串s，計算s

2020-07-08 10:23:34

Language Model and Recurrent Neural Networks （一）

本文是我去年十月份在公司的團隊技術分享會里面分享過的內容，分享這個內容的初衷是我發現自己對RNN(本文均指Recurrent Neural Networks而非Recursive Neural Networks)比較陌生，想找個

2020-07-08 04:31:28

Word Embeddings And Word Sense

最近在學習2019版的CS224N，把所聽到的知識做成筆記，以便自己不時地回顧這些知識，另外還希望可以方便沒有時間看課程的朋友們用來做個快速的overview（當然，親自上課是最好的選擇）。我也儘量地把所有課程的知識細節都寫出來

2020-07-08 04:31:28

##好好好好###开源的标注工具

## 開源的標註工具自然語言處理標記工具彙總 https://blog.csdn.net/wangyizhen_nju/article/details/94559607 spacy原來有兩個標註工具，displaCy-ent和displ

2020-07-08 02:12:32

NLP训练营之问答系统——替换用户输入句子中错误单词

替換用戶輸入句子中錯誤單詞構建詞典庫需要生成所有候選集合讀取路透社語料庫構建語言模型：bigram用戶打錯的概率統計 - channel probalility主函數構建詞典庫 # Python rstrip() 刪除 str

2020-07-07 21:48:25

DP之最大连续子序列

最大連續子序列 def maxSubArray(self, nums): # 判斷特殊情況 if len(nums) == 1: return nums[0] # 先初始化

2020-07-07 21:48:25

DP之 0-1 揹包问题

0-1 揹包問題 import numpy as np def knapsack(w, v, C): # 重量和價值一一對應的數組，揹包的容量 # 定義存儲空間並初始化 mem = np.ze

2020-07-07 21:48:25

DP之零钱兑换问题

零錢兌換問題 def coinChange(coins, amount): # 給你的零錢面額(不限數量）要湊的總面額 # 異常判斷特殊情況（完全不可能有解的情況！） if amount =

2020-07-07 21:48:25

语义角色标注相关论文解析

語義角色標註（Semantic Role Labeling，SRL）的使用範圍很廣泛，可以作爲信息抽取（Information Extraction）、自動答覆（Question Answering）、機器翻譯（Machine T

2020-07-07 18:10:12

HanLP《自然语言处理入门》笔记--3.二元语法与中文分词

文章目錄3. 二元語法與中文分詞3.1 語言模型3.2 中文分詞語料庫3.3 訓練與預測3.4 HanLP分詞與用戶詞典的集成3.5 二元語法與詞典分詞比較3.6 GitHub項目筆記轉載於GitHub項目：https://gi

2020-07-07 14:41:56

Word2vec_1

初識Word2vec Christopher Manning CS224n 2019秋 Overview Word2vec由Mikolov 在2013年提出，是一個學習詞向量（表示）的框架。 Idea 現實世界中，首先

2020-07-07 14:29:43

【NLP CS224N笔记】Lecture 12 - Information from parts of words Subword Models

本次梳理基於Datawhale 第12期組隊學習 -CS224n-預訓練模塊詳細課程內容參考(2019)斯坦福CS224n深度學習自然語言處理課程 1. 寫在前面自然語言處理( NLP )是信息時代最重要的技術之一，也是人工智

2020-07-07 14:07:57

吴恩达自然语言处理专项课程一览表(英译中)

1. 介紹由吳恩達主持的NLP課程。網址上面鏈接打不開，可在B站看，網址計劃：先翻譯全視頻，其次按照課程簡要歸納概括，最後自己寫總結博客。時間安排：2020-7-6~2020-9-30 2. 課程內容 Course 1:

2020-07-07 13:42:25

【读书笔记】《推荐系统(recommender systems An introduction)》第六章推荐系统的解释

如何給推薦系統的結果給予解釋？ 1. 基於約束的推薦系統：這種系統的商品都有各種屬性，用戶只知道個大概，但是不完全清楚各種屬性，推薦系統在幫助用戶一步步接近用戶最終的期望。屬性就是產生推薦理由的關鍵。本書中採用了一些推理方法來生成理由

2020-07-07 07:13:57

2019年CS224N课程笔记-Lecture 5: Linguistic Structure: Dependency Parsing

資源鏈接：https://www.bilibili.com/video/BV1r4411，部分內容參考來自於碼農場 » CS224n筆記6 句法分析和https://zhuanlan.zhihu.com/p/110532288 補充內容

任菜菜学编程

2020-07-07 04:20:10

24小時熱門文章

最新文章

最新評論文章