分類概述

分類概述

原創

宝G

2018-09-04 10:22

決策樹

決策樹以自頂向下, 遞歸分治的方式構造
屬性的選擇基於啓發式或統計度量(例如,信息增益)
節點上的樣本遞歸地基於選定的屬性劃分停止劃分的條件

樸素貝葉斯

先給個實例
類: C1:buys_computer=‘yes’ C2:buys_computer=‘no’

數據樣本
X =(age<=30, income=medium, student=yes, credit_rating=fair)

每個類的先驗概率P(Ci)可以根據訓練樣本計算
P(buys_computer = yes) = 9/14 = 0.643
P(buys_computer = no) = 5/14 = 0.357

使用以上概率,我們得到 P(X|Ci)
P(X|buys_computer=“yes”)= 0.222  0.444  0.667  0.667 =0.044
P(X|buys_computer=“no”)= 0.6  0.4 x 0.2  0.4 =0.019

P(X|Ci) P(Ci )
P(X|buys_computer=“yes”) * P(buys_computer=“yes”)=0.028
P(X|buys_computer=“no”) * P(buys_computer=“no”)=0.007

因此,對於數據樣本X,樸素貝葉斯分類預測buys_computer =” yes”

如果P(xk|Ci)爲0,進行拉普拉斯變換

優點
易於實現，在數據較少的情況下仍然有效，可以處理多類別問題
在大部分情況下能夠得到很好的結果
當類條件獨立假定成立時,樸素貝葉斯分類是最精確的
缺點
假定: 類條件獨立 , 因而損失精度
實踐中, 變量之間存在依賴關係—-類條件獨立的假定不切實際
對於輸入數據的準備方式較爲敏感
適用數據類型：標稱型數據

混淆矩陣評估分類器好壞

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

決策樹

樸素貝葉斯

混淆矩陣評估分類器好壞

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

java由於越界導致的報錯

標稱屬性的概念分層

學習網站與資源推薦

批處理

Git

Shell腳本

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結