[閱讀筆記]《統計學習方法》李航著：Chp5 決策樹

原創

2020-06-16 03:47

[閱讀筆記]《統計學習方法》李航著：Chp5 決策樹

本章概要

5.1 決策樹模型與學習

損失函數：正則化的極大似然函數，策略：最小化損失函數
樹的生成停止條件：
1. 所有訓練數據子集都被基本正確分類
2. 沒有合適的特徵
可能產生過擬合現象因此需要剪枝
決策樹的生成考慮局部最優，剪枝則考慮全局最優

5.2 特徵選擇

Why：特徵數量很多，通過選擇留下對訓練數據有足夠分類能力的特徵
How/準則：信息增益、信息增益比

5.3 決策樹的生成

ID3：信息增益，只有樹的生成易過擬合
C4.5：信息增益比

5.4 決策樹的剪枝

可以在局部進行，因此可以用動態規劃算法實現

5.5 CART算法

假設決策樹爲二叉樹
生成：生成的樹儘可能大；迴歸樹-平方誤差最小化；分類樹-基尼指數最小化
剪枝：用驗證數據集對已生成的樹進行剪枝並選擇最優子樹，準則——損失函數最小

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

論文閱讀筆記：(YOLO 看一次就夠了) You Only Look Once: Unified, Real-Time Object Detection

尊重原創，轉載請註明：http://blog.csdn.net/tangwei2014 這是繼RCNN，fast-RCNN 和 faster-RCNN之後，rbg（Ross Girshick）大神掛名的又一大作，起了一個很娛樂化的

2020-07-07 08:02:37

[胡說八道]《我是一隻IT小小鳥》讀後感

《我是一隻IT小小鳥》一隻是我想讀list中一個本，但是上次去噹噹買的時候，竟然缺貨了。。。昨天監考，實在無聊，就上網看電子書了，一天就看完了，看得有點倉促，所以理解估計不深。 1.劉帥:在失望中尋找希望　　他提的最多的是：基礎

2020-07-04 21:35:59

閱讀筆記：富爸爸-商學院

閱讀筆記：富爸爸-商學院20080212# 致富之道三種教育 1.學校, 獲得智力教育2.職業, 獲得賺錢的能力3.財商, 讓金錢爲我們服務，而不是我們爲金錢服務。懂得管理，投資自己的資金是一項重要的技能。不同的致富途徑通過節儉攢錢

2020-07-03 13:26:37

CRAQ論文筆記

Object Storage on CRAQ（使用分配查詢的鏈式複製） High-throughput chain replication for read-mostly workloads（對於讀高負載的高吞吐鏈式複製）論文地

2020-07-02 01:40:40

深入理解JAVA虛擬機-1

類的加載，連接與初始化加載：查找並加載類的二進制數據；連接：驗證（確保被加載類的正確性），準備（爲類的靜態變量分配內存，並將其初始化爲默認值），解析（把類中的符號引用轉換爲直接引用）；初始化：爲類的靜態變量賦予正確的初始

2020-06-30 01:32:55

深入理解JAVA虛擬機-2

JVM參數設置： -XX:+<option>開啓option選項；例如，-XX:+TraceClassLoading用於追蹤類的加載信息並打印出來； -XX:-<option>關閉option選項； -XX:<option>=<value

2020-06-30 01:32:55

【閱讀筆記】Falsification of Cyber-Physical Systems Using Deep Reinforcement Learning

FM2018 Falsification of Cyber-Physical Systems Using Deep Reinforcement Learning （International Symposium on Formal

2020-06-29 06:08:16

【閱讀筆記】Safe Reinforcement Learning for Control Systems: A Hybrid Systems Perspective and Case Study

碩士論文題目：SAFE REINFORCEMENT LEARNING: AN OVERVIEW, A HYBRID SYSTEMS PERSPECTIVE, AND A CASE STUDY HSCC：Safe Reinforce

2020-06-29 06:08:14

LDA（Latent Dirichlet Allocation）相關論文閱讀小結

關於主題挖掘，LDA（Latent Dirichlet Allocation）已經得到了充分的應用。本文是我對自己讀過的相關文章的總結。 1. 《LDA數學八卦》http://pan.baidu.com/s/18KUBG 把標

2020-06-27 22:45:48

條件隨機場(3)——學習和預測

看了兩天理論，終於輪到學習和預測上了。下載安裝了CRF++-0.58，準備程序分析來理解CRF的主要過程。 CRF++算法源程序是C++編寫的，主要的原生接口有三個：學習和預測用的crf_learn和crf_test，供其他語言

2020-07-05 15:00:45

樸素貝葉斯（待補充貝葉斯網絡）

一、條件概率公式： P(A∣B)=P(AB)P(B)P(A|B)=\frac{P(AB)}{P(B)}P(A∣B)=P(B)P(AB) 指的是在事件B發生的條件下事件A發生的概率二、全概率公式目標是求“最後結果”的概率,

weixin_43249938

2020-06-30 22:08:04

統計學習方法之邏輯迴歸(Logistic Regression)

邏輯迴歸之所以叫邏輯是因爲他用到了邏輯分佈: 圖形如下：還是按照老樣子，根據李航老師的統計學習方法三部分進行學習。 1 模型假設輸入爲任意範圍內的屬性值，輸出爲0－1之間的概率。給定一個閾

约瑟夫的杂货店

2020-06-29 23:32:50

SIFT原理

轉載請註明出處：http://blog.csdn.NET/luoshixian099/article/details/47377611 相關： KD樹+BBF算法解析 SURF原理與源碼解析

约瑟夫的杂货店

2020-06-29 23:32:39

《統計學習》筆記（2）-- EM算法

EM算法（1）EM算法是一種迭代算法，用於含有隱變量的概率模型參數的極大似然估計，或極大後驗概率估計。（2）EM算法的每次迭代由兩步組成：E步，求期望；M步，求極大。所以這一算法稱爲期望極大算法，簡稱EM算法。（3）觀

2020-06-29 04:02:06

CNN卷積神經網絡之卷積運算的初步理解

上述的卷積方式是帶有反轉的卷積，而不帶反轉的卷積操作稱爲互相關卷積，在進行卷積的過程中需要指明屬於哪一種卷積。對於5.6式子中，如果i，j分別取1，很明顯會出現x取到-1位置的情況，我個人理解是可能這個時候的卷積就屬於無效卷積了，因

2020-06-28 23:56:31

24小時熱門文章

最新文章

最新評論文章