大津法（OTSU 最大類間方差法）詳細數學推導（公式繁雜，歡迎討論）

大家新年快樂哇, 武漢加油，我的家鄉溫州也加油，中國加油！向前線人員致敬！

最近在家裏做遷移學習，受限於筆記本的限制，深度方向做不了，開始看師兄的論文，發現論文裏提到最大方差法，但是沒有具體說明出處，去查找相應的出處，也就看到了大津算法，但很奇怪的是，好多人都是很簡略地說了思想，到底怎麼出來的，還是沒明白，因此自己找唄~

將進行一個閾值即兩類的推導，讓思想動起來！

大津算法提出了兩個方差(若有人知道更早的出處歡迎留言指出)。
1.within-class variance 類內方差
2.between-class variance 類間方差

提前指出結論

1.大津法的目標就是最大化類間方差
2.實現最大化類間方差同時就實現了類內方差最小化，因爲二者的平方和爲定值
3.最優閾值點一定存在

具體程序就麻煩小夥伴自己找找啦。

~~ 進入正題 ~~

現在有一張灰度圖含有背景圖像和目標圖像( $C_0, C_1$ )，我們要找到一個閾值將像素值分爲兩塊使兩者最好的區分。

圖來源於網絡，右圖類間差異大，區分明顯。所以最大化類間差異

現在再來看看公式推導

將圖片的像素值分爲 [1, 2, …, L] 個水平，用 $n_i$ 表示各個水平像素值的像素個數，那麼很容易得到總像素個數爲

$N = n_1 + n_2 + ... + n_L$

我們利用像素值對應個數與總數的商作爲某個像素值出現的概率，定義 $p_i$

$p_i = n_i / N_i, p_i \ge0, \sum_{i=1}^L p_i=1$

定義兩個量 $w_0, w_1$ 爲 $C_0, C_1$ 的局部概率之和，並且得到二者的關係

$w_0 = Pr(C_0) = \sum_{i=1}^k p_i = w(k)$

$w_1 = Pr(C_1) = \sum_{i=k+1}^L p_i = 1-w(k)$

由此我們得到總的數學期望和 $C_0, C_1$ 各自的數學期望並指出三者的關係，式中 $i$ 代表像素值，除於各自概率的和用於進行歸一。

$u_T = u(L) = \sum_{i=1}^L i*p_i$

$u_0 = \sum_{i=1}^k i*Pr(i|C_0)=\sum_{i=1}^k i*p_i/w_0 = \dfrac{u(k)}{w(k)}$

$u_1 = \sum_{i=k+1}^L i*Pr(i|C_1)=\sum_{i=k+1}^L i*p_i/w_1 = \dfrac{u_T - u(k)}{1-w(k)}$

並指出以上公式之間的關係：

$w_0u_0+w_1u_1 = u_T \space \space \space \space \space \space \space w_0+w_1 = 1$

除了數學期望，計算各自局部方差和總方差

$\sigma_T^2=\sum_{i=1}^L (i-u_T)^2p_i$

$\sigma_0^2=\sum_{i=1}^k (i-u_0)^2Pr(i|C_0)=\sum_{i=1}^k (i-u_0)^2p_i/w_0$

$\sigma_0^1=\sum_{i=k+1}^L (i-u_1)^2Pr(i|C_1)=\sum_{i=k+1}^L (i-u_1)^2p_i/w_0$

基礎打完，爲了大家翻遍查閱，列一個表格方便查閱

變量/公式	相關含義
$p_i$	某個像素值可能出現的概率
$w_0/w(k), w_1$	$C_0, C_1$ 對應的概率和
$u_T, u_0, u_1$	整個圖像， $C_0$ ， $C_1$ ，像素的數學期望
$\sigma_T,\sigma_0,\sigma_1$	整個圖像， $C_0$ ， $C_1$ ，像素的方差
$\sum i*p_i$	數學期望的求解公式
$\sum (i-u)^2*p_i$	方差的求解公式

定義完以上變量，作者提出
within_class variance 類內差異

$\sigma_w^2=w_0\sigma_0^2+w_1\sigma_1^2$

between_class variance 類間差異

$\sigma_b^2=w_0(u_0-u_T)^2+w_1(u_1-u_T)^2$

之前指出，作者要求最大化類間差異，我們可以從圖中明白這個道理，那麼爲什麼最大化類間差異就是最小化類內差異？

有意思的來了，因爲二者的和爲定值

$\sigma_w^2 + \sigma_b^2 = \sigma_T^2$

以下爲推導公式

我們取 $\sigma_w^2$ ， $\sigma_b^2$ 中的 $w_0\sigma_0^2$ 和 $w_0(u_0-u_T)^2$ 兩項，先將 $w_0\sigma_0^2$ 展開

$\space =w_0[\frac1w_0*\sum_{i=0}^k(i-u_0)^2p_i]=w_0[\frac1w_0*\sum_{i=0}^k((i-u_T)+(u_T-u_0))^2p_i]$

$\space =w_0[\frac1w_0*\sum_{i=0}^k((i-u_T)^2+2(i-u_T)(u_T-u_0)+(u_T-u_0)^2)p_i]$

$\space =\sum_{i=0}^k(i-u_T)^2 *p_i$

$+\sum_{i=0}^k2(i-u_T)(u_T-u_0)*p_i$

$+(u_T-u_0)^2*\sum_{i=0}^kp_i$

展開 $\sum_{i=0}^k2(i-u_T)(u_T-u_0)*p_i$

$=2(u_T-u_0)\sum_{i=0}^k(i-u_T)p_i$

$\space =2(u_T-u_0)[\sum_{i=0}^kip_i+u_T\sum_{i=0}^kp_i]$

根據數學期望和局部概率和的定義得到

$\sum_{i=0}^k2(i-u_T)(u_T-u_0)*p_i = 2(u_T-u_0)w_0(u_0-u_T)=-2w_0(u_T-u_0)^2$

得 $w_0\sigma_0^2$ 化簡爲

$\space =\sum_{i=0}^k(i-u_T)^2 *p_i-w_0(u_T-u_0)^2$

從 $\sigma_b^2$ 的第一項可以發現，二者的和恰爲
$\sum_{i=0}^k(i-u_T)^2 *p_i$

同理推得第二項，則

$\sigma_b^2+\sigma_w^2 = \sum_{i=0}^k(i-u_T)^2 p_i + \sum_{i=k+1}^L(i-u_T)^2 p_i=\sum_{i=0}^L(i-u_T)^2 p_i = \sigma_T^2$

因此類內差異與類間差異的和爲總的方差，爲一定值

那麼爲什麼最優閾值一定存在呢？

從 $\sigma_b^2$ 的定義出發
已知

$w_0u_0+w_1u_1 = u_T$

因此

$\sigma_b^2=w_0(u_0-u_T)^2+w_1(u_1-u_T)^2$

$\space =w_0(u_0-(w_0u_0+w_1u_1))^2+w_1(u_1-(w_0u_0+w_1u_1))^2$

$\space =w_0w_1(u_1-u_0)^2$

再根據

$u_0 = \dfrac{u(k)}{w(k)} \space \space \space \space u_1=\dfrac{u_T - u(k)}{1-w(k)}$

得

$\sigma_b^2=\dfrac{[u_Tw(k)-u(k)]^2}{w(k)[1-w(k)]}$

求解最大類間差異可寫作

$\sigma_b^2(k^*)=\max_{1\le k<L}\sigma_b^2(k^)$

由上述 $\sigma_b^2$ 的分母可以發現， $w(k)$ 可以取到1也可以取到0，因此在邊界上 $\sigma_b^2$ 可以無窮大，而在開集 $(0,1)$ 則類間方差有限，因此在定義域

$S^* = {k:w_0w_1=w(k)[1-w(k)]>0}$

總存在最優解。

完成三條結論的推導

等等~

會不會有小夥伴在想
$\max_{1\le k<L}\sigma_b^2(k^)$

這個問題怎麼解哇！

哈哈，我也不會，目前就是一個點一個點的代入哇，找到最大值即可。但是我最近在學凸優化這門課，相信自己學完是能解決這個的！

一起加油！

元宵快樂，芝麻湯圓最好吃了！

[1] Otsu, N. (1979) A threshold selection method from gray-level histogram. IEEE Transactions on Systems, Man and Cybernetics, 9, 62-66.

亞里仕多德

發佈了8 篇原創文章 · 獲贊 8 · 訪問量 1萬+

私信關注

大津法（OTSU 最大類間方差法）詳細數學推導（公式繁雜，歡迎討論）

語音信號處理筆記（python實現）[最新更新：interpolate.interp1d的使用]

神經網絡最優學習率尋找（基於keras）

對於組卷積(group convolutional)的理解(torch.nn.Conv2d中的group參數)

阿里雲輕量應用服務器（WordPress）本地更新流程（2020/2/17）

爬蟲及文本分析心得（For The NewYork Times, The Washington Post，Los Angeles Times， Chicago Tribune）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結