如何理解Bayes貝葉斯公式|如何理解極大似然法|這兩個有什麼關係?貝葉斯定理是什麼|貝葉斯公式在機器學習中有什麼用?

貝葉斯公式=貝葉斯定理

貝葉斯公式到底想說啥

貝葉斯公式就是想用概率數學來表示事件發生依賴關係。
貝葉斯公式長下面這樣:
在這裏插入圖片描述

用圖形怎麼表示貝葉斯公式

P(X=x)P(X=x)就是X的面積。
P(Y=y)P(Y=y)就是Y的面積。
P(X=xY=y)P(X=x|Y=y)是什麼?P(X=xY=y)P(X=x|Y=y)是指Y發生的情況下X發生的概率。用圖形表示就是,只看Y的情況下Y裏面的X佔比多少。這不就是相交部分除以Y的面積麼?相交部分計算方式=X的面積*相交部分佔X的比率。
再看看前面的公式就完全能理解了。
在這裏插入圖片描述

貝葉斯公式在機器學習中有什麼用?

答:用於參數估計。機器學習做的事情其實就是找到一個概率分佈函數,輸入一個數據輸出是這個數據屬於某個類的概率。
那麼怎麼找這個概率分佈函數呢?一般是默認是高斯分佈。
假設樣本的概率分佈是高斯分佈。高斯分佈長下面這樣,有兩個參數uσu和\sigma。貝葉斯公式就是用來估計這兩個參數。
在這裏插入圖片描述
那麼貝葉斯公式怎麼估計這兩個參數你呢?將uσu和\sigma記作爲θ\theta。也就是說我們需要估計θ\theta的值是多少。
在這裏插入圖片描述
其中P(X=xθ=θ^)==fθ^(x)P(X=x|\theta=\hat {\theta})==f_{\hat \theta}(x)。上面那個公式的意思就是說,θ\theta有很多很多取值,θ^\hat \theta是其中一個。那麼怎麼知道哪個最好呢?計算θ^\hat \theta是X的最好參數的可能性P(θ=θ^X=x)P(\theta = \hat \theta |X=x),哪個可能性最大就選哪個參數。這就是極大似然法。,極大似然法就是現有有多個可能的參數取值,我不知道取哪個最好。爲了知道取哪個最好。我要計算出各個參數爲優參數的可能性。然後將可能性最大的那個參數作爲目前的概率分佈函數最優參數。
那假如θ\theta取值無限種情況呢?
θ\theta取值無限的情況下,需要用梯度下降優化極大似然法這個等式.下面這個等式。不懂梯度下降可以看看這兩篇文章
https://www.zhihu.com/question/305638940/answer/670034343
https://blog.csdn.net/varyshare/article/details/89556131
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章