原创 從單層感知機到LSTM

單層感知機 擁有輸入層、隱含層、輸出層。輸入的特徵向量通過隱含層變換達到輸出層,在輸出層得到分類結果。只能處理很簡單的函數。 多層感知機(現在叫神經網絡NN) 特點:包含多個隱含層;    使用sigmoid和tanh等連續函數模擬神經

原创 Generative Model 與 Discriminative Model(一)

 原文:http://blog.sina.com.cn/s/blog_6742eecd0100iqcv.html 【摘要】    - 生成模型(Generative Model) :無窮樣本==》概率密度模型 = 產生模型==》預測

原创 機器學習複習——FP Growth

FP Growth: FP Growth是一種比Apriori更高效的頻繁項挖掘方法,它只需要掃描項目表2次。其中第1次掃描獲得當個項目的頻率,去掉不符合支持度要求的項,並對剩下的項排序。第2遍掃描是建立一顆FP-Tree(frequen

原创 機器學習複習——各類算法優缺點總結

算法 優點 缺點 決策樹(Decision Trees) 1.   易於理解和解釋; 2.   數據的準備簡單或者是不必要的.其他的技術往往要求先把數據一般化,比如去掉多餘的或者空白的屬性。 3.   能夠同時處理數據

原创 集成學習——Boosting和Bagging

link: http://m.blog.csdn.net/blog/fenghuangdesire/45013167 集成學習 基本思想:如果單個分類器表現的很好,那麼爲什麼不適用多個分類器呢? 通過集成學習可以提高整體的泛化能力,但是這

原创 【LeetCode】Simplify Path實現(Java版)

描述 Given an absolute path for a file (Unix-style), simplify it. For exampl

原创 KMP算法及java實現

【參考資料】 關於KMP算法,大家可以查閱博客園的這篇文章: 阮一峯:字符串匹配的KMP算法 這篇解釋文章相當簡明,當然july的這篇文章也可以讀一讀: 六之續、由KMP算法談到BM算法 【算法原理】 這裏抄錄第

原创 spark相關書籍

1、大數據技術叢書:Spark快速數據處理,其實就是《Fast Data Processing with Spark》英文書的翻譯版本,一共就114頁,講的非常淺顯,還不如直接看英文的。樣本下載:http://download.csdn

原创 scala class的三個分類

scala新手入~~~~ class 1.類名可以和對象名爲同一個名字,該對象稱爲該類的伴生對象; 2.類和伴生對象可以相互訪問他們的私有屬性,但是他們必須在同一個源文件內; 3.類只會被編譯,不能直接被執行; 4.類的

原创 Caffe虐心安裝之路

在安裝Caffe之前,覺着它好強大好神祕,就想着迫不及待的安裝了並親驗一把,並把安裝過程完整寫下來。 經過兩天的煎熬終於安裝完了,不過整個過程真的很虐心,坑很多,很多,很多~~~~~欲哭無淚。。。 總是在安裝過程中冒出各種各樣的問題,以至

原创 SVM學習(二):線性分類器

1.線性分類器概念           線性分類器(一定意義上,也可以叫做感知機) 是最簡單也很有效的分類器形式.在一個線性分類器中,可以看到SVM形成的思路,並接觸很多SVM的核心概念。用一個二維空間裏僅有兩類樣本的分類問題來舉個小例

原创 正則化與數據先驗分佈的關係

過擬合的原因:使用的模型過於複雜,根據VC維理論:VC維很高的時候,就容易發生bias很低,但variance很高的情形. 解決過擬合最常用的方法就是regularization, 常用的有:L1正則, L2正則等.L1正則會使得參數

原创 SVM學習(一):SVM概念

           SVM算法學習之旅,首先介紹一下SVM概念。         支持向量機(Support Vector Machine)是Cortes和Vapnik於1995年首先提出的,它在解決小樣本、非線性及高維模式識別中表現出

原创 機器學習評價指標大彙總

轉自:http://www.zhaokv.com/2016/03/ml-metric.html 在使用機器學習算法的過程中,針對不同場景需要不同的評價指標,在這裏對常用的指標進行一個簡單的彙總。 一、分類 1. 精確率與召

原创 Generative Model 與 Discriminative Model(二)

 原文:http://blog.csdn.net/zouxy09/article/details/8195017 一、決策函數Y=f(X)或者條件概率分佈P(Y|X)        監督學習的任務就是從數據中學習一個模型(也叫分類器)