台部落zhenghao0114

本文主要講解決策樹模型，以及基於決策樹模型的bagging、boosting模型。一、決策樹模型決策樹模型概覽下面是一個決策樹的例子決策樹可以看作是對多維空間的劃分，上面的二維空間中，橫線條代表以x作爲劃分的fe

2020-07-05 14:12:15

本文先簡要介紹序列標註的經典模型，然後以醫療文本實體識別爲例，來介紹CRF和LSTM的應用。一、序列標註的經典模型參考論文 Neural Architectures for Named Entity Recognition

2020-07-05 14:12:05

分類變量(categorical variables)是機器學習中一類很重要的特徵。所謂分類變量，是指包含固定數量的可能性取值的變量。分類變量的每一個取值代表一個組，或一個類別。他們和順序變量的區別在於，分類變量不同的類別之間的距離是

2019-04-09 10:48:33

http://www.xuyankun.cn/2017/05/13/bayes/ https://alexanderetz.com/2015/07/25/understanding-bayes-updating-priors-via

2019-04-06 15:34:12

論文 Item-Based Collaborative Filtering Recommendation Algorithms https://www.cnblogs.com/gt123/p/3451565.html 論文 D

2019-03-18 10:52:18

本章主要介紹三種常用的模型，即邏輯迴歸、場感知因子分解機和剃度提升樹。 3.1 邏輯迴歸 3.1.1 邏輯迴歸的原理邏輯迴歸的loss function爲代入梯度下降公式爲優化方法常採用L-BFGS，主要是針對離線批量處理。

2018-10-09 23:53:41

2.1 特徵提取從數學的角度，特徵工程就是將原始數據空間變換到新的特徵空間，所以特徵提取就是對原始數據進行變化的過程。特徵工程和模型之間存在trade off，即特徵工程如果很複雜，即使用簡單的模型也可以得到不錯的結果。如果特徵工

2018-10-06 04:46:26

1.1 評估指標評估指標用於反映模型效果。在預測問題中，要評估模型的效果，就需要將模型的預測結果f(X)f(X)f(X)和真實標註YYY進行比較，評估指標定義爲f(X)f(X)f(X)和YYY的函數。通常，線下使用的是機器學習評估

2018-09-29 23:47:07

本文是論文 Combining Distributed Vector Representations for Words的讀書筆記。

2018-08-22 13:54:12

本文主要介紹HMM和CRF兩種模型。一、HMM模型我們以序列標註爲例來引入HMM模型。我們怎麼產生一個句子，方法可以是先根據語法產生一個詞性序列，然後由每個詞性產生一個詞（藉助詞典，這個詞典是詞性到詞的映射，一個詞性對應多個詞）

2018-08-22 13:54:10

本文是論文 Neural Network Models for Paraphrase Identification, Semantic Textual Similarity, Natural Language Inference, and

2018-08-22 13:54:10

一、huffman樹定義及用途哈夫曼樹又稱最優二叉樹，是帶權路徑長度（WPL）最短的樹,可以構造最優編碼，用於數據傳輸，數據壓縮等方向下面是二叉樹與huffman樹的例子二、概念路徑：樹中一個結點到另一個結點之間的分支序列構

2018-08-22 13:54:10

本文主要總結文本分類的方法。文本分類的本質是文本相似性的度量、計算。文本重點介紹五種相似性的度量方法：即TF-TDF，word embedding pooling，textCNN、textRNN模型，attention network

2018-08-22 13:54:10

參考資料： 1. http://www.deeplearningpatterns.com/doku.php?id=attention 2. https://zhuanlan.zhihu.com/p/37835894 3. Hiera

2018-08-22 13:54:10

原理參考： https://blog.csdn.net/m0_37788308/article/details/78196674?locationNum=9&fps=1 spark實現參考： https://blog.csdn.net

2018-08-22 13:54:10