原创 【最新試驗】用預訓練模型Roberta做序列標註_自然語言處理_使用RobertaForTokenClassification做命名實體識別pytorch版

有了bert,roberta還會遠嗎,目前pytorch transformer上已經放出了bertForTokenClassification 然而,在工業界前進的我們,不能忍受如此慢速的更新 於是我們自己寫好了robertaForTo

原创 【最新試驗】用預訓練模型xlnet做序列標註_自然語言處理_使用XlnetForTokenClassification做命名實體識別pytorch版

ner,命名實體識別是關係抽取中非常重要的一個任務。通常命名實體指的是時間,地點,人名,組織名等等。 而中文命名實體識別由要比英文更加複雜。這裏我用xlnet來做ner。   首先第一步是處理數據 我們首先在github上找到一個數據彙總

原创 pytorch從glove詞向量源文件中生成embedding並載入

首先是下載glove文件 格式爲txt,每一行開頭是單詞,後面是100個float類型數,空格隔開,因此我們載入這個文件,並取出每一行 def get_numpy_word_embed(word2ix): row = 0

原创 Tensorflow 循環神經網絡 RNN文本匹配 問答匹配 (accuracy 74%)(3)

這篇博客是記錄我做文本匹配的一些嘗試,現在依然用之前的淘寶數據,準確度74%。 之前的博客已經講解了句子序列是怎麼回事了,現在我們把文本分類問題改寫成問答匹配問題。那麼顯然現在我們的輸入變成了兩個句子,輸出依然是分類標籤。那麼兩個句子經過

原创 中文詞性標註part of speech tagging數據彙總序列標註數據語料

2014人民日報 1998人民日報 國家語委 treebank msra微軟亞洲研究院

原创 判斷numpy 中 infinite 和NAN的問題

在numpy中由於numpy太強大了,經常會計算出一些不合法的結果,若不注意放入model中訓練。就會報錯 今天教大家一個測試數據是否合法的函數 np.isnan(y) 上面的y是一個數 ,return 返回值爲True False

原创 unity_在canvas中修改text和text到底是什麼

打開unity 的界面 create game object create component  都可以找到text 這是咋回事?? 其實text 就是Text類型。一個Text example,它的內容屬性就是text example

原创 UNITY的transform到底是什麼?

今天在寫unity的code,想實現修改給定canvas中的text內容。在api查了很久也沒找到。打開了自己以前寫的code,如果要把一個text掛在canvas上,很簡單,設置text的父元素爲canvas就行了,有點像JavaScr

原创 【最新試驗】使用BertForTokenClassification做命名實體識別序列標註pytorch版

閱讀這篇文章你需要知道什麼是bert? bert幾乎時最新最強的預訓練模型之一。使用方法很簡單,只需要一塊gpu,大概8g顯存,再取github上找到pytorch transformer這個repo,最後運行裏面的run glue.py

原创 【對話系統】rasa源代碼閱讀-探索memoization policy是如何實現的

很久沒更新這個博客了,今天工作中需要實現rasa的story流程功能,所以先看看rasa的源代碼找一些靈感。   首先我們先train一個對話模型,rasa -core是用來訓練和使用對話管理模型的。下面是train部分的代碼。 fro

原创 Keras 中加入lambda層無法正常載入模型問題

剛剛解決了這個問題,現在記錄下來   問題描述 當使用lambda層加入自定義的函數後,訓練沒有bug,載入保存模型則顯示Nonetype has no attribute 'get'     問題解決方法: 這個問題是由於缺少confi

原创 如何從頭開始用rasa根據自己的任務設計一個任務型對話機器人

以訂電影票爲例子。 我們首先要列出所有intent的名稱,rasa的intent的粒度較細,任何用戶輸入都可以被看做一個intent。因此我們需要枚舉出在一個場景下所有可能的用戶輸入的意圖。如我要訂電影票的intent是訂電影票,我要看鋼

原创 keras 問答匹配孿生網絡文本匹配 RNN 帶有數據

用途: 這篇博客解釋瞭如何搭建一個簡單的匹配網絡。並且使用了keras的lambda層。在建立網絡之前需要對數據進行預處理。處理過後,文本轉變爲id字符序列。將一對question,answer分別編碼可以得到兩個向量,在匹配層中比較兩個

原创 CNN句子分類TensorFlow網絡解析

概要: 這篇博客主要分析瞭如何用TensorFlow對句子建模,模型爲CNN,涉及到常用函數的參數及解釋。 首先放入 序列,進入embedding層,得到維度爲 [none,句子長度,詞向量維度,1]的張量,多的維度是用來做卷積的。