貝葉斯網絡分類器:
在貝葉斯網絡中將其中代表類別變量的結點作爲根結點,其餘所有的變量結點都作爲該類別變量結點的子結點,則貝葉斯網絡就變成了貝葉斯網絡分類器。構造分類器需要根據給定訓練樣本數據集(訓練集)作爲輸入,通過對訓練集進行訓練,歸納出分類器,利用分類器對沒有分類的數據進行分類。
貝葉斯網絡分類器概述
貝葉斯分類器是基於貝葉斯學習方法的分類器。設有變量集U={A1,A2,...,An,C},其中A1,A2,...,An是實例的n個屬性變量,實例可用向量xi=(a1,a2,…,an)表示,其中,ai是Ai的值,令C是類變量,c表示C的值。應用貝葉斯定理,實例xi屬於類cj的概率爲:
其中, 是正則化因子,P(a1,a2,…,an)的倒數,爲常量,p(cj)是類cj的先驗概率,p(cj|a1,a2,…,an)是類cj的後驗概率。先驗概率獨立於訓練數據集,而後驗概率反映了樣本數據對類cj的影響。貝葉斯分類模型參數學習的關鍵就是如何計算p(ai|a1,a2,…,ai-1,cj)。目前,不同貝葉斯分類模型的區別就在於,它們以不同的方式來求p(ai|a1,a2,…,ai-1,cj)。xi被分到c類,即g(e)=argmax p(c|a1,a2,…,an),稱g(e)爲貝葉斯分類器。
貝葉斯分類器同其他分類器相比具有如下特點:
(1)貝葉斯分類器並不把一個對象絕對地指派給某一類,而是通過計算得出屬於某一類的概率分佈;
(2)一般情況下在貝葉斯分類器中所有的屬性都潛在地起作用,即並不是一個或者幾個屬性決定分類,而是所有的屬性都參與分類;
(3)用於貝葉斯分類器分類的對象的屬性可以是離散的、連續的,也可以是混合的。
多模塊集成式貝葉斯網絡分類器
多模塊集成式貝葉斯網絡分類器是基於分治法的思想,將一個難以直接解決的大問題,分割成一些規模較小的問題,以便各個擊破,分而治之。該模型既具有結構簡單的優點。其思路將一個規模爲n的問題分解爲k個規模較小的子問題,最終使子問題縮小到很容易直接求出其解,而這些子問題互相獨立且與原問題等價。最後把各部分的解組合成整個問題的解。
貝葉斯網絡學習算法的準確性評價指標:預測準確度、計算複雜度和模型描述的簡潔度。
貝葉斯網絡分類器算法的準確性評價方法:利用似然概率評價網絡結構的準確性。