記錄一下線性迴歸推導。以後多寫寫博客,多記錄
線性迴歸公式 其中,w0爲參數,x0 爲樣本值,b 爲偏執項
可以記爲 (1)其中,wT爲轉置矩陣。
預測樣本和真實值之間存在誤差 其中 爲誤差
對於每個樣本都存在誤差 (2)
假設誤差 是服從獨立分佈的,並且服從高斯分佈,則有
(3)
將(2)代入(3)則有條件概率
(4)
在已知條件概率的情況下,可以使用最大似然函數來估計參數,也就說在知道y 和x 的情況下,可以估計w是真實樣本的最大概率是多少。
(5)
因爲求累乘很麻煩,因此轉爲求對數
(6)
左邊轉化:
(7)
繼續化簡
(8)
下一步:
(9)
最終化簡爲:
(10)
因爲L(w)是概率值,所以應該要求這個概率值越大越好,公式右邊第一項是常數,沒有影響,所以就要求第二項越小越好
因此得到目標函數:
(11)
爲了讓公式(11)越小越好,因此應該就是求函數的極小值。因爲公式(11)是凸函數,因此求極小值就是求導數爲0的點
將公式(11)展開
(公式打不上去,就去別去扒了一張圖來)
對其求偏導
(12)
(13)
對公式(13)化簡整理:
(14)
對矩陣求偏導,最終得到
(15)
求偏導等於0的點因此爲
(16)
即
到此求出參數w 與樣本之間的關係。
但這裏
不一定可逆,因此就涉及到了使用梯度下降的方式來求解。之後寫關於梯度下降的博客