林軒田之機器學習課程筆記( distilling hidden features之final)(32之32)

歡迎轉載,可以關注博客:http://blog.csdn.net/cqy_chen
本次的課程筆記完畢。後面的課程筆記主要是hinton大神的深度學習課程。

希望在看問題之前看看機器學習的處理流程,這樣流程中的每個步驟很多地方採用不同的模型。
這裏寫圖片描述

概要

上傳講到了矩陣分解這樣的模型,本節是對這次課程的一個總結。

特徵提取技巧

kernel 轉換

我們學習到了各種各樣的轉換,kernel轉換,然後kernel再配合線性模型就可以做一些非線性模型。
這裏寫圖片描述

aggravatiton 轉換

決策樹樁,決策樹,RBF就相當於基函數,然後通過blending的方法進行模型融合。各種模型之間融匯貫通。
這裏寫圖片描述

自動提取特徵

這裏相當於把特徵看做一個變量,自動提取的方式實現。Adaboost這樣的模型可以把基本的函數看做特徵,最後做了模型融合。
這裏寫圖片描述

低維度轉換

把之類投影到低維度上去,然後進行計算。
這裏寫圖片描述

優化技巧

最優化

一般優化技巧就是梯度下降的方式。
這裏寫圖片描述
這裏通過梯度下降,還有一些變形,比如泰勒二次展開,可能就是牛頓法了。

問題轉換

這裏原始問題比較難,通過對偶,表示等方法進行求解。
這裏寫圖片描述

子問題求解方式

當原問題比較難,通過問題拆解的方式,或者交互的方式求解。
這裏寫圖片描述

過擬合處理方式

當模型足夠複雜的時候,容易過擬合,這個時候可能就需要做一些正則化的事情。

踩剎車方式

常用的方式就是在一些地方限制模型的能力,加上一些條件。
這裏寫圖片描述

盯住儀表盤

當模型過於複雜的時候,要時刻看看模型的情況,比如通過交叉驗證的方式。
這裏寫圖片描述

機器學習實踐

這裏介紹的是林老師在kddcup中的實踐。
2010年的kddcup的流程
這裏寫圖片描述
2011年kddcup的步驟:
這裏寫圖片描述

2012年kddcup
這裏寫圖片描述

2013年的kddcup
這裏寫圖片描述

2006年統計的十大數據挖掘算法
這裏寫圖片描述

一堆機器學習算法,學會融匯貫通。
這裏寫圖片描述

歡迎轉載,可以關注博客:http://blog.csdn.net/cqy_chen

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章