原创 bert概述

bert原理:https://terrifyzhao.github.io/2019/02/18/BERT%E5%8E%9F%E7%90%86.html bert代碼:https://terrifyzhao.github.io/2019/0

原创 推薦算法概述

推薦算法具有非常多的應用場景和商業價值,因此對推薦算法值得好好研究。推薦算法種類很多,但是目前應用最廣泛的應該是協同過濾類別的推薦算法,本文就對協同過濾類別的推薦算法做一個概括總結,後續也會對一些典型的協同過濾推薦算法做原理總結。 1.

原创 Transformer模型

https://terrifyzhao.github.io/2019/01/11/Transformer%E6%A8%A1%E5%9E%8B%E8%AF%A6%E8%A7%A3.html

原创 推薦算法詳解

推薦算法具有非常多的應用場景和商業價值,因此對推薦算法值得好好研究。推薦算法種類很多,但是目前應用最廣泛的應該是協同過濾類別的推薦算法,本文就對協同過濾類別的推薦算法做一個概括總結,後續也會對一些典型的協同過濾推薦算法做原理總結。 1.

原创 NLP-關鍵詞提取

關鍵詞提取算法一般也能分爲有監督和無監督。 1、有監督的關鍵詞提取算法主要是通過分類的方式進行的,通過構建一個較爲豐富和完善的詞表,然後通過判斷每個文檔與詞表中每個詞的匹配程度,以類似打標籤的方式,達到關鍵詞提取的效果。有監督的方法能夠獲

原创 NLP算法工程師的學習和成長

1.NLP解決什麼問題; 2.NLP算法發展簡史; 3.檢索式問答系統的語義匹配模型; 4.任務型對話系統背後的算法實例; 5.創業公司NLP工程師的工作職責; 6.NLP算法工程師面試注意事項; 其中前兩個小節主要大概講述一下NLP這個

原创 任務型客服系統簡述

這裏的分類是這樣分的:首先將對話分爲問答與會話,在問答中按照文檔是否結構化分爲無結構化文檔與結構化文檔。無結構化文檔中包含一些如IR信息檢索(如QA對,查找文檔的問題),IE信息抽取(如閱讀理解,查找文檔中的精確片段),這一塊的難點在於

原创 深度學習中優化函數的比較

  1.引言 (本文參考AI聖經《深度學習》一書,僅作爲學習交流) 本文梳理SGD,標準動量SGD,Nesterov動量SGD算法,以及Adagrad, AdaDelta,Adam,RMSProp,Nesterov動量RMSProp自適應

原创 半監督文本分類項目總結

明天寫。。。

原创 NLP中模型的一些總結

明天更。。。

原创 CRF原理和viterbi算法詳解

明天更。。。

原创 HMM詳解

什麼是熵(Entropy) 簡單來說,熵是表示物質系統狀態的一種度量,用它老表徵系統的無序程度。熵越大,系統越無序,意味着系統結構和運動的不確定和無規則;反之,,熵越小,系統越有序,意味着具有確定和有規則的運動狀態。熵的中文意思是熱量被溫

原创 實體識別和關係抽取的聯合模型總結

實體識別和關係抽取的目標是從非結構化的文本中發現(實體1、關係、實體2)的三元組,它對知識庫的構建和問答任務都很重要,是信息抽取的核心問題。 現有的關係抽取方法主要有兩種: 1.使用流水線方法進行抽取:先對句子進行實體識別,然後對識別出的

原创 seq2seq簡單總結

1.什麼是seq2seq: 最基礎的Seq2Seq模型包含了三個部分,即Encoder、Decoder以及連接兩者的中間狀態向量,Encoder通過學習輸入,將其編碼成一個固定大小的狀態向量c,繼而將c傳給Decoder,Decoder再