線性迴歸筆記

1 單元線性迴歸

一個因素x一個實驗結果y之間的關係。在實際中想要測得兩者的關聯,比如打籃球身高和每場籃板數量的關係。

很明顯身高x是確定的,但是籃板數量確是隨機的。不同的人即使身高相同每年比賽的平均籃板也不一樣。我們只是

認爲y是一個隨機變量,會隨着x的不同y均值會變化。

因此這個問題就簡化成x的變化與y的均值變化的關係。設y的均值是u,那麼u(x)就是待求函數。

u(x)有時是線性的,有時是非線性的,那麼在線性的時候,他的公式必然是u(x)=ax+b。

因此我們的測量數據集是x和y的數據對,用最小均方的代價函數來表示就變成

Q=累加(y-u(x))^2

然後Q取最小值時得到的a和b即是待求參數。

————————————————————————————————————————————————

2 多元線性迴歸

假設此時的y和x1、x2有線性關係,那麼此時的函數就變成了u(x1,x2)=ax1+bx2+c

接下來的步驟和上面一樣。

————————————————————————————————————————————————

3 線性迴歸的進一步介紹

爲什麼叫回歸?

有多個隨機變量,最有興趣的就是y,其它的就是X(x1,x2,。。。,xn)。y稱爲依賴變量或響應(response);X稱爲獨立變量或迴歸量(regressor),這樣的模型稱爲迴歸模型。

最簡單的線性迴歸模型求解其參數W(w1,w2,。。。wn)最簡單的有兩種,一種是概率模型,一種是最小二乘模型。

最後都是得到代價函數公式,得到公式後就是得到一個多輸入單輸出的函數,輸出是總的誤差,以W爲變量找到這個函數的最小值點,就是目標值。

另外一提的就是對W的先驗知識,或說是正則化項。

我覺得正則化可以這麼解釋:假設一個人之前對某一件事有某種看法,比如這個世界上沒有壞人,堅信這種看法,然後他的行爲就會導致他相信任何人,相信一個騙子以後肯定被騙,被騙的很慘以後就受到刺激,受到刺激就性情大變,以後可能就認爲這個世界上都是壞人。

但是假如說你一開始就認爲這世界上都是壞人,那麼你被騙也不會受到刺激,因爲你認爲世界就是這樣的。

那麼我們設置網絡有一個保守的估計,就是我們活在世界上肯定要接觸各種事,那麼假如你遇到一個壞事就認爲世界上沒好人肯定不對,你遇到好事就說世界上沒壞人肯定也不對。所以我們就給你思想一個拉力,我們不會因爲某一件事輕易的對世界的性質下結論。這就是正則化。

在最大後驗估計裏就設置W的分佈是高斯分佈,他的期望值是0,是中性的,直接導致的後果就是我的先驗知識認爲X的各元素是與y無關係的。

————————————————————————————————————————————————————



























發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章