原创 Self-Attention概念詳解

一、Self-Attention概念詳解   Self-Attention詳解 瞭解了模型大致原理,我們可以詳細的看一下究竟Self-Attention結構是怎樣的。其基本結構如下   上述attention可以被描述爲將query和

原创 零次學習(zero-shot learning)基本概念

零次學習(zero-shot learning)基本概念 每次在實驗室做工作彙報的時候,總會把ZSL的基本概念講一遍,但是每次的效果都不是很好,工作都講完了,提的第一個問題依然是:ZSL到底是什麼?這讓我一度認爲我的表達能力有問題。。。。

原创 kbqa論文集合

https://github.com/BshoterJ/awesome-kgqa

原创 集中模型公式速查

1 lstm 2 GCN,其中A爲圖的鄰接矩陣

原创 tensorflow loss爲nan 梯度截斷

global_step = tf.Variable(0, trainable=False) learning_rate = tf.train.exponential_decay(config.base_learning_rate, gl

原创 匹配相關資源

https://nlp.stanford.edu/projects/snli/ https://github.com/RaRe-Technologies/gensim-data/issues/32

原创 treelstm

導讀 我們一步一步來。先說最基礎的RNN結構: 公式爲: 就一個簡單的隱層h。 但是RNN的缺點是會有梯度爆炸或者梯度消失問題。這裏我就不詳細解釋了。下面推薦閱讀有我之前的RNN,LSTM詳細講解,想更深一步瞭解的可以去看看。 因爲這個

原创 bot相關NLP任務

https://gitee.com/wwfcoder/nlp_xiaojiang

原创 GCN

圖卷積網絡(Graph Convolutional networks, GCN) 簡述 1 背景 卷積神經網絡(CNN)的輸入是圖片等具有歐幾里得結構的圖結構,也就是這樣的圖: 這樣的“圖”並不是廣義上的“圖”。我們經常需要提取廣義的具

原创 工作ppt相關

1 ppt注意事項 (1)先自己搭邏輯架構然後在寫

原创 tensorflow model轉爲pb文件以及python調用

1 模型轉pb # coding=utf-8 from tensorflow.contrib.saved_model.python.saved_model.utils import simple_save from options i

原创 maven install時跳過test

1、方法 在maven install打包時,默認會執行測試方法,如果測試失敗則打包失敗,所以在打包時可以跳過測試。共有兩種方法: (1)命令方式 mvn install -Dmaven.test.skip = true (2)配置文件方

原创 python常用

1 字符串中加空格 " ".join(list(user_q)) 2 dic轉json hjson = json.dumps(stand_q_dic, ensure_ascii=False) 3 str轉json hjson =

原创 使用google colab運行RNN網絡代碼報告錯誤"ValueError: Object arrays cannot be loaded when allow_pickle=False"

原因是numpy版本太高,降低其版本即可,我是降numpy降到1.13.1 使用RNN網絡訓練IMDB數據集,因本地機器運算速度過慢而選擇google colab, 代碼(train_data,train_labels),(test_da