原创 決策樹學習之概念理解和代碼實現

前言: 在學習《python數據挖掘入門與實踐》的決策樹球隊預測後,爲了更好的瞭解決策樹學習,我又閱讀了李航老師的《統計學習方法》決策樹章節內容。這本書被許多大神極力推薦,我在閱讀後也發現確實不負盛名。我將在這做個小結,希望能夠

原创 Python pandas模塊之Dataframe操作彙集

前言: 在學習過程,不斷地接觸到dataframe,而數據框也確實是非常好用的。故在此總結一下我遇到問題查的的資料。如果有沒說到的望補充。 創建dataframe: 創建dataframe的數據集可以是列表,數組和字典 >>>

原创 他山之石——後綴樹

匠心十年的文章《後綴樹》 https://www.cnblogs.com/gaochundong/p/suffix_tree.html 努力的小何的文章《後綴樹的構造方法-Ukkonen詳解 》 http://blog.163

原创 《python數據挖掘入門與實踐》決策樹預測nba數據集

前言: 學到決策樹預測球隊輸贏時,按照書中網址去下載數據集,無奈怎麼也沒下載成功。即使下載了excel文件也是破損的。咱可是學了python的銀,那好吧,我就把它爬取下來。(資源在下面) 代碼: ''' 爬取《python

原创 基於Aprion算法的電影推薦

前言: 最近在參加比賽,選了推薦系統的賽題。接觸到了各種推薦系統的算法,學習了許多大神的論文。非常感謝他們的科研,讓我們能更注重於應用。這篇文章權當做個引子,後續會補充我比賽的具體。 知識儲備: Apriori算法可以說是經典

原创 java泛型詳解及它的應用

泛型的本質: 類型參數化 引入目的:建立具有類型安全的集合框架,如鏈表,散列表等數據結構 他山之石: 1.作者:VieLei 側重:詳解 地址:https://blog.csdn.net/s10461/article/det

原创 用python對twitter進行數據挖掘之TimeoutError

問題一: TimeoutError: [WinError 10060] A connection attempt failed because the connected party did not properly respon

原创 String[] args 的意義及myeclipse中輸入命令行參數

意義: *String[] args: args是“參數”的縮寫,可以改成任意的名字。 args存貯的是命令行參數,可用於程序中。 *支持從命令行輸入參數:

原创 支持向量機的代碼實現

前言: 本篇文章主要實現了《機器學習實戰》的支持向量機部分,我在代碼中也儘量描述了對應公式的哪些變量。我建議搭配《統計學習方法》進行實戰,下面這篇博文對於公式推導也是很不錯的。 https://blog.csdn.net/u0

原创 機器學習實戰——樸素貝葉斯分類

準備數據:從文本中構建詞向量 前期測試函數用的數據 def loadDataSet(): '''創建一些實驗樣本''' postingList = [['my','dog','has','flea','proble

原创 KNN算法知識集

數學知識: 李航《統計學習方法》,敘述了K鄰近算法,K鄰近模型和它的三要素(距離度量、K值、分類決策規則),然後講解了算法實現的數據結構——kd樹,和基於這個樹的搜索kd樹算法。 一些數學細節的補充: https://www.

原创 DataFrame排除特定行

Pandas刪除數據的幾種情況 https://www.cnblogs.com/cocowool/p/8421997.html pandas.DataFrame排除特定行 https://www.cnblogs.com/wuz

原创 Python的numpy模塊之zeros()

使用:import numpy as np np.zeros((數組形狀),dtype,older) 返回:一個指定形狀的數組,其元素爲0的指定type 參數:數組形狀:(5,) (5,5)  dtype: ‘float’, ‘in

原创 Sklearn庫的train_test_split()

作用:將數據集隨機劃分爲訓練集和測試集 使用:X_train,X_test,Y_train,Y_test = train_test_split(X,Y,random_state = 0) 返回:X_train,X_test,Y_t

原创 遍歷函數iterrows()和enumerate()

iterrows(): 說明:是屬於DataFrame(數據框)的遍歷函數 使用:一般與循環搭配 for index, row in dataframe.iterrows(): ... 返回:(index,row)對 en