原创 python實現連續變量最優分箱--CART算法

關於變量分箱主要分爲兩大類:有監督型和無監督型 對應的分箱方法: A. 無監督:(1) 等寬 (2) 等頻 (3) 聚類 B. 有監督:(1) 卡方分箱法(ChiMerge) (2) ID3、C4.5、CART等單變量決策樹算法 (3) 

原创 python實現卡方分箱Chi-Merge

卡方分箱是依賴於卡方檢驗的分箱方法,在統計指標上選擇卡方統計量(chi-Square)進行判別,分箱的基本思想是判斷相鄰的兩個區間是否有分佈差異,基於卡方統計量的結果進行自下而上的合併,直到滿足分箱的限制條件爲止。 卡方分箱的實現步驟:

原创 連續變量最優分箱--基於CART算法

關於變量分箱主要分爲兩大類:有監督型和無監督型對應的分箱方法:A. 無監督:(1) 等寬 (2) 等頻 (3) 聚類B. 有監督:(1) 卡方分箱法(ChiMerge) (2) ID3、C4.5、CART等單變量決策樹算法 (3)  信用

原创 最優分箱--卡方分箱Chi-Merge

卡方分箱是依賴於卡方檢驗的分箱方法,在統計指標上選擇卡方統計量(chi-Square)進行判別,分箱的基本思想是判斷相鄰的兩個區間是否有分佈差異,基於卡方統計量的結果進行自下而上的合併,直到滿足分箱的限制條件爲止。卡方分箱的實現步驟:卡方