隨機森林有放回抽樣

爲什麼要有放回抽樣

  1. 如果不放回抽樣,每棵樹用的樣本完全不同,結果是有偏的,基學習器之間的相似性小,投票結果差,模型偏差大
  2. 如果不抽樣,基學習器用所有樣本,那麼模型的泛化能力弱,基學習器之前相似性太大差異性太小,模型的偏差大
  3. 爲什麼不隨機抽樣? 自助採樣首先可以產生一部分袋外樣本,可以用來做袋外估計,另一方自助採樣一定程度上改變了每個基學習器的所用數據的樣本分佈,一定程度上引入了噪音,增加了模型的泛化能力
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章