原创 有關Pca的使用:樣本數目和降維數目的關係

先說我的結論:降維後維數一定要小於數據樣本數 最近在做扭曲圖形的識別,思路是用使用一幅靜態圖像,建立扭曲方程,生成一系列不同形態的扭曲圖像,再做Pca降維,生成10個特徵基向量,任何一幅扭曲圖像都向基向量投影,產生10個特徵係數,根據特徵

原创 LIBSVM使用指南

LIBSVM是較爲成熟的支持向量機的函數包(包含C\MATLAB\PYTHON\R等等) 下載網址:http://www.csie.ntu.edu.tw/~cjlin/libsvm/ 本文內容基於其官網給出的《A Pract

原创 11行Python代碼編寫神經網絡

參考網址:http://iamtrask.github.io/2015/07/12/basic-python-network/ 先上代碼 X = np.array([ [0,0,1],[0,1,1],[1,0,1],[1,1,1] ]

原创 c#.net 獲取時間日期年月日時分秒格式(轉)

今天寫代碼發現兩個比較不錯的分享下: 1.DateTime.ParseExact 很多時候我們獲取的時間是數字形式表示的,好比20140127134015.927856,通過這個方法 DateTime.ParseExact("201401

原创 Scikit-learn機器學習實戰之Kmeans

摘要 上篇博客談到了如何安裝Python中強大的機器學習庫scikit-learn:Windos環境安裝scikit-learn函數庫流程,本篇主要是對其Kmeans示例進行學習。 有關Kmeans的介紹可以參見這篇博客: K均值聚類算法

原创 邏輯迴歸模型(logistic regression)

邏輯迴歸模型意義 邏輯迴歸是機器學習中做分類任務常用的方法,屬於“廣義的線性模型”,即: 考慮二分類任務,其輸出標記y∈{0,1},而線性迴歸模型產生的預測值 z = wx+b是實值,於是,需要將實值z轉換爲0/1值。最理想的是“單位階

原创 支持向量機SVM

支持向量機由於其優異的性能,在機器學習中與神經網絡共享美譽。 支持向量機的前身是最優間隔分類問題,在後者基礎上加上核函數,便搖身一變爲了SVM。 本文參考周志華《機器學習》以及吳恩達網易公開課《機器學習》 問題描述 給定訓練樣本訓練集D=

原创 招聘單位對機器學習工作校招的要求總結

這兩天看到學校論壇內討論這個問題,就粘貼到這裏,算是mark一下,有新發表的再更新。 (1) (2) (3) (4) (5) (6) 點贊 2 收藏 分享 文章舉報

原创 最全的國外機器學習資源(上)

這次又準備了什麼必備收藏? 不怕閃瞎你的金剛鑽鈦合金人眼! 全是機器學習最牛B的框架、庫和軟件! 小編吐血整理,堪稱史上最全! 一、C++ 計算機視覺 CCV—基於C語言/提供緩存/核心的機器視覺庫,新穎的機器視覺庫 OpenCV—它

原创 最全的國外機器學習資源(下)

集齊上下兩篇,可召喚神龍哦~ 爲看官奉上機器學習資源——下篇。 最牛B的框架、庫和軟件,至此終於收齊啦! ____________________________________________________________

原创 2016—迷茫的研究生生活

看了好幾篇“我的2016”,感覺都挺勵志的,反觀我的2016,一路充滿了坎坷和迷茫,在此回顧一下。 先介紹一下自己的背景,北京某985大學本碩(保研)。看到題目中“迷茫”的字眼,可能以爲我是剛剛步入研究生學術生涯,還未尋找到研究方向;其

原创 coursera斯坦福Andrew Ng的機器學習編程作業答案

剛剛學完了這個課程(開心),感覺講的還是比較好的,簡單易懂,如果想了解數學過程的話最好去看網易雲公開課。 coursera課程,斯坦福Andrew Ng的機器學習編程作業答案(2-9章,共8個),本來也不難,主要是怕哪出遇到死衚衕,可以

原创 Python機器學習實戰之kNN手寫識別系統

k近鄰學習 k近鄰(k-Nearest Neighbour,簡稱kNN)學習是一種常用的監督學習方法,其工作機制非常簡單:給定測試樣本,基於某種距離度量找出訓練集與其最近的k個訓練樣本,然後基於這k個“鄰居”的信息來進行預測。通常,在分類

原创 windos環境安裝Numpy函數庫流程

最近要用Python學機器學習,Numpy函數庫是必不可少的啊!! 在網上搜了不少,提供的解決辦法包括 1.pip install Numpy.whl   2.直接下載Numpy.exe,這個網上也很多,Numpy.exe 3.用Py

原创 Python機器學習實戰之決策樹分類

決策樹 決策樹是一種常用的機器學習方法,它基於樹的結構,依次根據不同屬性值來進行數據分類,具體算法原理及細節可以參考之前寫的決策樹和MATLAB函數使用 決策樹的優點:採用遞歸進行數據訓練、數據分類,因此計算複雜度不高,可以清晰理解哪些屬