從無到有,陸陸續續一個數據挖掘入門系列的教程就寫了18篇博客了,這個是我沒有想到的,本來以爲可能寫10篇博客就結束了,但是寫着寫着寫着寫着就寫了這麼多:
- 數據挖掘入門系列教程(一)之親和性分析
- 數據挖掘入門系列教程(二)之分類問題OneR算法
- 數據挖掘入門系列教程(三)之scikit-learn框架基本使用(以K近鄰算法爲例)
- 數據挖掘入門系列教程(四)之基於scikit-lean實現決策樹
- 數據挖掘入門系列教程(五)之Apriori算法Python實現
- 數據挖掘入門系列教程(六)之數據集特徵選擇
- 數據挖掘入門系列教程(七)之樸素貝葉斯進行文本分類
- 數據挖掘入門系列教程(八)之使用神經網絡(基於pybrain)識別數字手寫集MNIST
- 數據挖掘入門系列教程(九)之基於sklearn的SVM使用
- 數據挖掘入門系列教程(十)之k-means算法
- 數據挖掘入門系列教程(十一)之keras入門使用以及構建DNN網絡識別MNIST
- 數據挖掘入門系列教程(十二)之使用keras構建CNN網絡識別CIFAR10
總的來說,這個系列的博客寫的不是很滿意,因爲不知爲何自己就把側重點放到到機器學習上面去了,使得這個系列的博客越來越像機器學習的入門博客┑( ̄Д  ̄)┍,對數據具體如何處理反而沒有做什麼介紹。但是,這個也不能怪我,實在是《Python數據挖掘入門與實踐》 這本書到後面就開始介紹神經網絡了,然後呢我又對其進行了補充(補充了CNN的內容以及介紹)。同時書中的“圖”和“mapreduce”的內容沒有做介紹!!!emm,我嫌麻煩就懶得弄了。
是新手的我,剛開始以爲數據挖掘和機器學習很難,但是機緣巧合的接觸到了《Python數據挖掘入門與實踐》這本書,在書中,剛開始以一個很簡單的算法:數據挖掘入門系列教程(一)之親和性分析 讓我頓時覺得,哇!怎麼這麼簡單。儘管這本書很老了,但是卻讓我以一種無腦的方式開始了我的學習之旅。但是到後面就有一點坑(比如說使用SVM,但是卻不告訴我SVM是什麼🤮)。
儘管這個教程目前來說我不是很滿意,但是同時系列也不會再進行更新(糾錯除外)。想了想,儘管這個教程作爲一個數據挖掘的教程明顯是不合格的,但是對於入門教程來說,自我感覺還是🆗的,因爲對於入門的我們來說,並不需要去深入去了解數據挖掘及其算法,它只需要告訴我們:
而只有當我們提起興趣之後,我們才能夠更好的進行學習。因此看完這教程的時候,就更應該繼續看書了,更加深入的去了解數據挖掘。
長路漫漫唯鍵盤作伴,數據挖掘沒有這麼簡單,但是當我們對其產生興趣的時候,也許它也就變得簡單了。我們尋找一個個數據背後所蘊含的規律,跟隨前人的步伐甚至突破,最後得到滿意的結果時,看着自己掉落的頭髮,emm好像也值得了??
項目地址:Github
Talk is cheap, show me the code.
如果有任何問題,歡迎私信或mail。