貝葉斯算法擴展（支持多分類處理）

原創

2020-02-25 21:07

在前一節中我們已經討論了關於貝葉斯算法的工作原理以及代碼實現，但是它處理的數據是二分類問題，這一節我們就將代碼稍微修改一下使其能夠實現多分類問題。主要有兩個函數需要進行修改一個是trainNB0(),一個是classifyNB()這兩個，接下來我們就來講解一下這兩個函數：

def trainNB0(trainMatrix,trainCategory):
    numTrainDocs = len(trainMatrix)
    numWords = len(trainMatrix[0])
    labeldis = {}
    labelnum = {}
    Num = {}
    Denom = {}
    Vect = {}
    for n in range(len(trainCategory)):
        if trainCategory[n] not in labelnum.keys():
            labelnum[trainCategory[n]] = 1
        labelnum[trainCategory[n]] += 1
    lennum = len(labelnum)
    label = labelnum.keys()
    for i in range(lennum):
        labeldis[label[i]] = labelnum[label[i]]/float(numTrainDocs)
        Num[label[i]] = ones(numWords)
        Denom[label[i]] = 2.0                      
    for i in range(numTrainDocs):
        for n in range(lennum):
            if trainCategory[i] == label[n]:
                Num[label[n]] += trainMatrix[n]
                Denom[label[n]] += sum(trainMatrix[n])
    for i in range(lennum):
        Vect[label[i]] = log(Num[label[i]]/Denom[label[i]])         
    return Vect,labeldis

上面就是修改後的函數，這裏新創建了幾個字典變量，labelnum用來存儲各個標籤的個數，用於計算每個標籤出現的頻率，算出來的值存儲在labeldis字典變量中，Num用來存儲向量的和，Denom則用來存儲總詞數。最後的Vect用來存儲概率向量。基本和二分類沒有太大的差別。

def classifyNB(vec2Classify, Vect, labeldis):
    val = 0.0
    result = ''
    label = Vect.keys()
    for i in range(len(Vect)):
        p = (sum(vec2Classify * Vect[label[i]]) + log(labeldis[label[i]]))
        if p > val or i == 0:
            val = p
            result = str(label[i])
    return result

循環遍歷字典計算出概率，選擇出概率最高的向量的標籤返回。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

貝葉斯算法擴展（支持多分類處理）

[軟件工具百科] 互聯網資源歷史快照歸檔站點與數字圖書館

網易面試：SpringBoot如何開啓虛擬線程？

杭州的 IT 崩盤了麼？

程序員常見的文本查看工具

VS2022 解決方案打不開 .NET Framework 4.0 、 4.5 等老項目

Vue3 運行可以，build 打包發佈報錯，app.config.globalProperties 用法坑

既然測試也要求寫代碼，那乾脆讓開發兼任測試不就好了嗎？

ITSM落地經驗之建設藍圖規劃

PDF 補丁丁 1.0.2 版更新

奇怪！應用的日誌呢？？

Logistic迴歸算法（梯度上升）

線性迴歸2（局部加權迴歸）

K--近鄰算法示例

Logistic迴歸（隨機梯度上升）

java.lang.RuntimeException: java.lang.NoSuchMethodException: tfidf$Reduce.()

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結