歡迎轉載,可以關注博客:http://blog.csdn.net/cqy_chen
本次的課程筆記完畢。後面的課程筆記主要是hinton大神的深度學習課程。
希望在看問題之前看看機器學習的處理流程,這樣流程中的每個步驟很多地方採用不同的模型。
概要
上傳講到了矩陣分解這樣的模型,本節是對這次課程的一個總結。
特徵提取技巧
kernel 轉換
我們學習到了各種各樣的轉換,kernel轉換,然後kernel再配合線性模型就可以做一些非線性模型。
aggravatiton 轉換
決策樹樁,決策樹,RBF就相當於基函數,然後通過blending的方法進行模型融合。各種模型之間融匯貫通。
自動提取特徵
這裏相當於把特徵看做一個變量,自動提取的方式實現。Adaboost這樣的模型可以把基本的函數看做特徵,最後做了模型融合。
低維度轉換
把之類投影到低維度上去,然後進行計算。
優化技巧
最優化
一般優化技巧就是梯度下降的方式。
這裏通過梯度下降,還有一些變形,比如泰勒二次展開,可能就是牛頓法了。
問題轉換
這裏原始問題比較難,通過對偶,表示等方法進行求解。
子問題求解方式
當原問題比較難,通過問題拆解的方式,或者交互的方式求解。
過擬合處理方式
當模型足夠複雜的時候,容易過擬合,這個時候可能就需要做一些正則化的事情。
踩剎車方式
常用的方式就是在一些地方限制模型的能力,加上一些條件。
盯住儀表盤
當模型過於複雜的時候,要時刻看看模型的情況,比如通過交叉驗證的方式。
機器學習實踐
這裏介紹的是林老師在kddcup中的實踐。
2010年的kddcup的流程
2011年kddcup的步驟:
2012年kddcup
2013年的kddcup
2006年統計的十大數據挖掘算法
一堆機器學習算法,學會融匯貫通。
歡迎轉載,可以關注博客:http://blog.csdn.net/cqy_chen