自然語言處理(NLP)算法分類總結

〇、推薦

無意中發現了一個巨牛的人工智能教程,忍不住分享一下給大家。教程不僅是零基礎,通俗易懂,而且非常風趣幽默,像看小說一樣!覺得太牛了,所以分享給大家。點這裏可以跳轉到教程。

一、人工智能學習算法分類

人工智能算法大體上來說可以分類兩類:基於統計的機器學習算法(Machine Learning)和深度學習算法(Deep Learning)

總的來說,在sklearn中機器學習算法大概的分類如下:

1. 純算法類

(1).迴歸算法
(2).分類算法
(3).聚類算法
(4)降維算法
(5)概率圖模型算法
(6)文本挖掘算法
(7)優化算法
(8)深度學習算法

2.建模方面

(1).模型優化
(2).數據預處理

二、詳細算法

1.分類算法

(1).LR (Logistic Regression,邏輯迴歸又叫邏輯分類)
(2).SVM (Support Vector Machine,支持向量機)
(3).NB (Naive Bayes,樸素貝葉斯)
(4).DT (Decision Tree,決策樹)

  • 1).C4.5
  • 2).ID3
  • 3).CART

(5).集成算法

  • 1).Bagging
  • 2).Random Forest (隨機森林)
  • 3).GB(梯度提升,Gradient boosting)
  • 4).GBDT (Gradient Boosting Decision Tree)
  • 5).AdaBoost
  • 6).Xgboost

(6).最大熵模型

2.迴歸算法

(1).LR (Linear Regression,線性迴歸)
(2).SVR (支持向量機迴歸)
(3). RR (Ridge Regression,嶺迴歸)

3.聚類算法

(1).Knn
(2).Kmeans 算法
(3).層次聚類
(4).密度聚類

4.降維算法

(1).SGD (隨機梯度下降)

5.概率圖模型算法

(1).貝葉斯網絡
(2).HMM
(3).CRF (條件隨機場)

6.文本挖掘算法

(1).模型

  • 1).LDA (主題生成模型,Latent Dirichlet Allocation)
  • 2).最大熵模型

(2).關鍵詞提取

  • 1).tf-idf
  • 2).bm25
  • 3).textrank
  • 4).pagerank
  • 5).左右熵 :左右熵高的作爲關鍵詞
  • 6).互信息:

(3).詞法分析

  • 1).分詞
    – ①HMM (因馬爾科夫)
    – ②CRF (條件隨機場)
  • 2).詞性標註
  • 3).命名實體識別

(4).句法分析

  • 1).句法結構分析
  • 2).依存句法分析

(5).文本向量化

  • 1).tf-idf
  • 2).word2vec
  • 3).doc2vec
  • 4).cw2vec

(6).距離計算

  • 1).歐氏距離
  • 2).相似度計算

7.優化算法

(1).正則化

  • 1).L1正則化
  • 2).L2正則化

8.深度學習算法

(1).BP
(2).CNN
(3).DNN
(3).RNN
(4).LSTM

三、建模方面

1.模型優化·

  • (1).特徵選擇
  • (2).梯度下降
  • (3).交叉驗證
  • (4).參數調優
  • (5).模型評估:準確率、召回率、F1、AUC、ROC、損失函數

2.數據預處理

  • (1).標準化
  • (2).異常值處理
  • (3).二值化
  • (4).缺失值填充: 支持均值、中位數、特定值補差、多重插補
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章