自然語言處理（NLP）算法分類總結

原創

2020-06-22 22:42

文章目錄

二、詳細算法

三、建模方面

〇、推薦

無意中發現了一個巨牛的人工智能教程，忍不住分享一下給大家。教程不僅是零基礎，通俗易懂，而且非常風趣幽默，像看小說一樣！覺得太牛了，所以分享給大家。點這裏可以跳轉到教程。

一、人工智能學習算法分類

人工智能算法大體上來說可以分類兩類：基於統計的機器學習算法(Machine Learning)和深度學習算法(Deep Learning)

總的來說，在sklearn中機器學習算法大概的分類如下：

1. 純算法類

(1).迴歸算法
(2).分類算法
(3).聚類算法
(4)降維算法
(5)概率圖模型算法
(6)文本挖掘算法
(7)優化算法
(8)深度學習算法

2.建模方面

(1).模型優化
(2).數據預處理

二、詳細算法

1.分類算法

(1).LR (Logistic Regression，邏輯迴歸又叫邏輯分類)
(2).SVM (Support Vector Machine，支持向量機)
(3).NB (Naive Bayes，樸素貝葉斯)
(4).DT (Decision Tree，決策樹)

1).C4.5
2).ID3
3).CART

(5).集成算法

1).Bagging
2).Random Forest (隨機森林)
3).GB(梯度提升,Gradient boosting)
4).GBDT (Gradient Boosting Decision Tree)
5).AdaBoost
6).Xgboost

(6).最大熵模型

2.迴歸算法

(1).LR (Linear Regression，線性迴歸)
(2).SVR (支持向量機迴歸)
(3). RR (Ridge Regression，嶺迴歸)

3.聚類算法

(1).Knn
(2).Kmeans 算法
(3).層次聚類
(4).密度聚類

4.降維算法

(1).SGD (隨機梯度下降)

5.概率圖模型算法

(1).貝葉斯網絡
(2).HMM
(3).CRF (條件隨機場)

6.文本挖掘算法

(1).模型

1).LDA (主題生成模型，Latent Dirichlet Allocation)
2).最大熵模型

(2).關鍵詞提取

1).tf-idf
2).bm25
3).textrank
4).pagerank
5).左右熵 :左右熵高的作爲關鍵詞
6).互信息：

(3).詞法分析

1).分詞
– ①HMM (因馬爾科夫)
– ②CRF (條件隨機場)
2).詞性標註
3).命名實體識別

(4).句法分析

1).句法結構分析
2).依存句法分析

(5).文本向量化

1).tf-idf
2).word2vec
3).doc2vec
4).cw2vec

(6).距離計算

1).歐氏距離
2).相似度計算

7.優化算法

(1).正則化

1).L1正則化
2).L2正則化

8.深度學習算法

(1).BP
(2).CNN
(3).DNN
(3).RNN
(4).LSTM

三、建模方面

1.模型優化·

(1).特徵選擇
(2).梯度下降
(3).交叉驗證
(4).參數調優
(5).模型評估：準確率、召回率、F1、AUC、ROC、損失函數

2.數據預處理

(1).標準化
(2).異常值處理
(3).二值化
(4).缺失值填充：支持均值、中位數、特定值補差、多重插補

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

自然語言處理（NLP）算法分類總結

文章目錄

〇、推薦

一、人工智能學習算法分類

1. 純算法類

2.建模方面

二、詳細算法

1.分類算法

2.迴歸算法

3.聚類算法

4.降維算法

5.概率圖模型算法

6.文本挖掘算法

7.優化算法

8.深度學習算法

三、建模方面

1.模型優化·

2.數據預處理

如何使用 JS 判斷用戶是否處於活躍狀態

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

《神經網絡和深度學習學習筆記》（一）運行TensorFlow

《機器學習實戰學習筆記》（三）：練習題（第2章端到端的機器學習項目）

jieba分詞詞性標註

---------------站內導航【算法和機器學習】---------------

《機器學習實戰學習筆記》（七）：訓練模型練習題

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結