bias 和 variance 的推導

參考 博客ooon

假設 XY滿Y=X+εε 是噪聲,εN(0,δ2ε)
f(X)f^(X)

Err(x0)=E[(y0f^(x0))2]=E[y202y0f^(x0)+f^2(x0)]=E[y20]2E[y0f^(x0)]+E[f^2(x0)]=E[y20]E2(y0)+E2(y0)2E[y0f^(x0)]+E[f^2(x0)]E2(f^(x0))+E2(f^(x0))

 E[y0]=E[f(x0+ε)]=E(f(x0))Var[y0]=E[(y0E[y0])2]=E[(y0+εy0)2]=E[ε2]Var[X]=E[X2]E2[X]

 Err(x0)=[E[y0]E[f^(x0)]]2+E[f^2(x0)]E2(f^(x0))+Var[ε]=[E[y0]E[f^(x0)]]2+Var[f^(x0)]+Var[ε]=Bias2(f^(x0))+Var[f^(x0)]+δ2ε

對於k近鄰,其預測誤差爲:

Err(x0)=E[(Yf^(x0))|X=x0]=δ2ε+[f(x0)1ki=1Kf(xi)]2+δ2ϵk

隨着 k 增大,var 會減小,而bias 會增大。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章