4. 樸素貝葉斯

簡介

貝葉斯法則: $P (A | B) * P (B) = P (B | A) * P (A)$

定義
設輸入空間X爲n維向量的集合, 輸出空間爲類標記集合Y={ $c_{1}, c_{2}, . . ., c_{k}]$ , 輸入爲特徵向量 $x \in X$ , 輸出爲類標記 $y \in Y$ , P(X,Y)是X和Y的聯合概率分佈, 訓練數據集T={ $(x_{1}, y_{1}), (x_{2}, y_{2}), . . ., (x_{n}, y_{n})$ }.
貝葉斯法通過訓練數據集學習聯合概率分佈P(X,Y)
條件獨立性假設:

P (X = x | Y = c_{k}) = P (X^{1} = x^{1}, . . ., X^{n} = x^{n} | Y = c_{k}) = \prod_{j = 1}^{n} P (X^{j} = x^{j} | Y = c_{k})

此處上標表示第j個特徵,樸素貝葉斯法的重要前提

基本方法

樸素貝葉斯分類時, 對給定的輸入x,通過學習到的模型計算後驗概率分佈 $P (Y = c_{k} | X = x)$ , 將後驗概率最大的類作爲x的類輸出:

P (X = x) = \sum_{k} P (X = x \cap Y = c_{k}) = \sum_{k} (P (X = x | Y = c_{k}) * P (Y = c_{k})) P (Y = c_{k} | X = x) = \frac{P (X = x | Y = c_{k}) * P (Y = c_{k})}{P (X = x)} = \frac{P (X = x | Y = c_{k}) * P (Y = c_{k})}{\sum_{k} (P (X = x | Y = c_{k}) * P (Y = c_{k}))} 綜合以上公式有: P (Y = c_{k} | X = x) = \frac{P (Y = c_{k}) * \prod_{j} P (X^{j} = x^{j} | Y = c_{k})}{\sum_{k} (P (Y = c_{k}) * \prod_{j} P (X^{j} = x^{j} | Y = c_{k}))} 也可表示爲: y = f (x) = a r g m a x_{c_{k}} \frac{P (Y = c_{k}) * \prod_{j} P (X^{j} = x^{j} | Y = c_{k})}{\sum_{k} (P (Y = c_{k}) * \prod_{j} P (X^{j} = x^{j} | Y = c_{k}))} 上式分母對所有的k都相同, 所以有: y = a r g m a x_{c_{k}} P (Y = c_{k}) * \prod_{j} P (X^{j} = x^{j} | Y = c_{k}) 即使 [P (X = x | Y = c_{k}) * P (Y = c_{k}))] 由聯合分佈=條件分佈*邊緣分佈的關係: P (x, y) = P (y | x) * P (x) = P (x | y) * P (y) 有如下: \begin{aligned} 1.損失函數的期望(離散): R_{e x p} (f) & = E [L (Y, f (X))] = \sum_{x} \sum_{y} L (y, f (x)) * P (x, y) \\ = \sum_{x} \sum_{y} L (y, f (x)) * P (y | x) * P (x) \\ = \sum_{x} (\sum_{y} L (y, f (x)) * P (y | x)) * P (x) \\ = \sum_{x} (\sum_{k = 1} L (c_{k}, y) * P (c_{k} | x)) * P (x) \\ = E_{x} (\sum_{k = 1} L (c_{k}, y) * P (c_{k} | x)) (E [g (X)] = \sum_{i} g (x_{i}) p_{i}) \end{aligned} \begin{aligned} 2.損失函數的期望(連續): R_{e x p} (f) & = E [L (Y, f (X))] = \int_{x} \int_{y} L (y, f (x)) * P (x, y) d x d y \\ = \int_{x} \int_{y} L (y, f (x)) * P (y | x) * P (x) * d x d y \\ = \int_{x} (\int_{y} L (y, f (x)) * P (y | x) d y) P (x) d x \\ = E_{x} (\int_{y} L (y, f (x)) * P (y | x) d y) (E [g (X)] = \int g (x) f (x) d x) \end{aligned} 以離散變量爲例, 爲了使期望最小化, 只需對X=x逐個極小化, 即: \begin{aligned} f (x) & = a r g m i n_{y} \sum_{k = 1}^{K} L (c_{k}, y) * P (c_{k} | X = x) \\ = a r g m i n_{y} \sum_{k = 1}^{K} P (y \neq c_{k} | X = x) 次處L爲0-1損失函數 \\ = a r g m i n_{y} (1 - P (y = c_{k} | X = x)) \\ = a r g m a x_{y} P (y = c_{k} | X = x) \end{aligned}

根據期望風險最小化就得到了後驗概率最大化

參數估計

y = a r g m a x_{c_{k}} P (Y = c_{k}) * \prod_{j} P (X^{j} = x^{j} | Y = c_{k}) 先驗概率的極大似然估計: P (Y = c_{k}) = \frac{\sum_{i = 1}^{n} I (y_{i} = c_{k})}{n}, k = 1, 2, . . ., k 設第j個特徵 x^{j} 的取值集合爲 (a_{j 1}, a_{j 2}, . . ., a_{j S j}), 條件概率的極大似然估計爲: P (X^{j} = a_{j l} | Y = c_{k}) = \frac{\sum_{i = 1}^{n} I (x_{i}^{j} = a_{j l}, y_{i} = c_{k})}{\sum_{i = 1}^{n} I (y_{i} = c_{k})}, j = 1, 2, . . ., n; l = 1, 2, . . ., S_{j}; k = 1, 2, . . ., K 其中n代表訓練數據集的數量, K代表分類數量, x_{i}^{j} 表示第i個樣本的第j個特徵, a_{j l} 第j個特徵可能取的第l個值; P (X^{j} = a_{j l} | Y = c_{k}) 表示在 Y = c_{k} 條件下, 樣本中第j個特徵等於 a_{j l} 的概率

算法

貝葉斯估計

當使用極大似然估計概率值時, 可能出現0的情況.
這時會影響到後驗概率的計算結果, 試分類產生偏差.
解決方法是添加一個正數

P (X^{j} = a_{j l} | Y = c_{k}) = \frac{\sum_{i = 1}^{n} I (x_{i}^{j} = a_{j l}, y_{i} = c_{k}) + λ}{\sum_{i = 1}^{n} I (y_{i} = c_{k}) + S_{j} λ} (λ \geq 0)

但

λ

=0時就是極大似然估計; 常取

λ

=1, 稱爲拉普拉斯平滑.
顯然對於任何

l = 1, 2, . . ., S_{j}

(

S_{j}

表示第j個特徵共有

S_{j}

個可能取值),

k = 1, 2, . . ., K

有:

P_{λ} (X^{j} = a_{j l} | Y = c_{k}) > 0 \sum_{l = 1}^{S_{j}} P (X^{j} = a_{j l} | Y = c_{k}) = 1

先驗概率的貝葉斯估計是:

P_{λ} (Y = c_{k}) = \frac{\sum_{i = 1}^{n} I (y_{i} = c_{k}) + λ}{n + K λ}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

4. 樸素貝葉斯

簡介

基本方法

參數估計

算法

貝葉斯估計

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

4. 樸素貝葉斯

2. 感知機

3. k近鄰學習

1. 統計學習方法概論

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結