偏差(bias)方差(variance)平衡

偏差和方差的區別是一個經常在面試中被問到的問題,其區別可以用一下的圖片來表示:


導致偏差的可能原因:
對問題本身的假設不正確:比如說對非線性數據使用線性迴歸,存在欠擬合現象。

導致高方差的可能原因:
數據的一點點擾動都可能會較大的影響模型,通常是由於模型太複雜引起:比如高階多項式迴歸。也就是說存在過擬合現象,在訓練數據表現很好,但是測試數據中表現很差。

通常兩者是矛盾的,降低偏差就會提高方差,降低方差就會提高偏差。
在機器學習中的主要挑戰,主要來自於方差。

關於泛化誤差、偏差、方差和模型複雜度的關係如圖所示(圖片來自於百面機器學習):


一般來說降低高方差的幾種方法:

1). 降低模型複雜度;
2). 降噪;
3). 增加樣本數;
4). 模型正則化等等。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章