線性迴歸中最小二乘的概率解釋

原創

2020-02-21 02:19

最小二乘法是常見的構造代價函數，擬合參數的方法，如下：

Cost=(h(x)-y)^2

這裏探討最小二乘的概率依據。

最大釋然理論

一個簡單的例子：

假設一個袋子裏有無限個球，白球出現的比例是P，黑球爲1-P。

那麼我從中取10個球，得到了7個白球，很自然的，我們會估計白球出現的比例P=0.7；

繼續，我們取100個球，得到了75個白球，我們會繼續估計P=0.75。

也就是，我們通過觀察到的事件，反過來推其中的概率分佈。

現在給定一個分佈D，假設其概率密度函數爲f(D)，其中有參數sita。我們從中採樣得到樣本x1,x2,…,xn,但是並不知道參數sita。那麼我們希望通過這些觀測值xi，反過來推導出最有可能的sita。

按照概率密度函數，寫出事件（x1,x2,…,xn）出現的聯合概率：

其中參數sita未知。

我們可以基於這樣一個假設：真實的sita會使得如上的事件（x1,x2,…xn）發生的概率最大。

於是，我們把sita當做未知數，得到一個最優化問題：

Max(P(x1,x2,…,xn))。

最終得到的sita就是我們對於未知參數的估計，也就是最大釋然估計。

在線性迴歸中，我們假設X，Y滿足線性相關：

在上述的最大釋然方法中，我們需要事先知道，或者假設樣本處於某種分佈，只是其中的參數未知。

這裏我們也可以假設y屬於某個分佈，得到其概率密度函數。因爲我們已有許多觀察值（y1,y2,…,yn），再套用上面最大釋然的方法，可以求得其中的未知參數。

一般的，我們假設y是關於x的線性函數，並且加上一個噪聲，這個噪聲可以是取樣或是其他各種原因造成的，寫成：

其中，e滿足高斯分佈：

那麼y也就滿足高斯分佈：

現在概率分佈假設寫出來了，直接套用最大釋然的方法，得到：

最大化如上的最大釋然函數，也就是最大化其中的，也就是最小二乘項。

當我們假設Y滿足高斯分佈時，使用最小二乘法，也就等於使用最大釋然法，其具備合理的概率解釋。

發佈了89 篇原創文章 · 獲贊 51 · 訪問量 36萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.