機器學習實戰----利用AdaBoost元算法的實現

整理一下寫的非常好的關於AdaBoost算法的博客:

1.1 基於第一步,因此外層循環即爲數據集特徵的循環;
1.1.1 如果是按照第一個特徵來劃分類別,那麼第一個特徵點中存在節點,即樹的左右分支,這個時候怎樣判斷是左還是右呢?
1.1.2 首先根據數據大小跟定一個閾值T,這裏我們T=minx+INT*stup,即最小特徵值(第一個座標的最小值或者。。。。。)+(1,2,3,4,5.....)*步長,這個閾值隨着整數值INT的改變而循環改變;大於閾值T的則爲“rt”,反之則爲“lt”;
1.1.3判斷錯誤率,初始化一個5*1的列向量e,全部爲1,如果預測結果和標籤相同,則將初始化對應的值修改爲0,最後再用一個權重向量D.T*e,這個值即爲最後的錯誤率,如果這個錯誤率小於一定的閾值,即爲最有的決策樹。
1.1.4 這裏要比較每個閾值T的結果是"rt"和"lt"的錯誤率,同時你還要判斷大循環中第一個特徵的錯誤率,或者第二個特徵的錯誤率;

https://blog.csdn.net/cherdw/article/details/78144098

https://blog.csdn.net/lvsolo/article/details/51031117這篇博客關於其中的D的公式的推導和使用寫的非常好,其中關於

《機器學習實戰》這本書上的代碼就是利用了這一公式,自己理解半天沒懂,這篇博客幫了大忙。


https://blog.csdn.net/xiaxzhou/article/details/72872270這篇博客人代碼完整,註釋清晰。

https://blog.csdn.net/haidao2009/article/details/7514787解釋清楚

推導+案例

https://blog.csdn.net/GYQJN/article/details/45501185

https://blog.csdn.net/guyuealian/article/details/70995333

https://blog.csdn.net/v_JULY_v/article/details/40718799


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章