推薦數據挖掘入門教材《數據挖掘與機器學習 WEKA應用技術與實踐》

該書由於去年剛出比較新,所以很難在網上下載到電子書,本人很幸運找到了前兩章的電子版,而第二章又是本書的關鍵,所以建議大家先看看第二章,如果覺的寫的好,可以再買書,或尋求電子版的全書,下載前兩章請到:http://download.csdn.net/detail/u010968153/8686369


圖書簡介:
本書藉助代表當今數據挖掘和機器學習最高水平的著名開源軟件Weka,通過大量的實踐操作,使讀者瞭解並掌握數據挖掘和機器學習的相關技能,拉近理論與實踐的距離。全書共分8章,主要內容包括Weka介紹、Explorer界面、Knowledge Flow界面、Experimenter界面、命令行界面、Weka高級應用、Weka API和學習方案源代碼分析。
作爲國內第一本系統講解Weka的書籍,本書內容全面、實例豐富、可操作性強,做到理論與實踐的統一。本書適合數據挖掘和機器學習相關人員作爲技術參考書,也適合作爲計算機專業高年級本科生和研究生教材或教學參考用書。

第1章  Weka介紹 1
1.1  Weka簡介 2
1.1.1  Weka歷史 2
1.1.2  Weka功能簡介 3
1.2  基本概念 4
1.2.1  數據挖掘和機器學習 4
1.2.2  數據和數據集 5
1.2.3  ARFF格式 6
1.2.4  預處理 7
1.2.5  分類與迴歸 10
1.2.6  聚類分析 11
1.2.7  關聯分析 12
1.3  Weka系統安裝 12
1.3.1  系統要求 13
1.3.2  安裝過程 13
1.3.3  Weka使用初步 15
1.3.4  系統運行注意事項 17
1.4  訪問數據庫 22
1.4.1  配置文件 22
1.4.2  訪問數據庫 23
1.4.3  常見問題及解決辦法 25
1.5  示例數據集 26
1.5.1  天氣問題 26
1.5.2  鳶尾花 28
1.5.3  CPU 29
1.5.4  玻璃數據集 29
1.5.5  美國國會投票記錄 30
1.5.6  乳腺癌數據集 31
課後強化訓練 31
第2章  Explorer界面 33
2.1  圖形用戶界面 34
2.1.1  標籤頁簡介 34
2.1.2  狀態欄 35
2.1.3  圖像輸出 35
2.1.4  手把手教你用 35
2.2  預處理 38
2.2.1  加載數據 38
2.2.2  屬性處理 40
2.2.3  過濾器 42
2.2.4  過濾器算法介紹 44
2.2.5  手把手教你用 49
2.3  分類 55
2.3.1  分類器選擇 56
2.3.2  分類器訓練 57
2.3.3  分類器輸出 58
2.3.4  分類算法介紹 61
2.3.5  分類模型評估 74
2.3.6  手把手教你用 77
2.4  聚類 94
2.4.1  聚類面板操作 94
2.4.2  聚類算法介紹 95
2.4.3  手把手教你用 97
2.5  關聯 102
2.5.1  關聯面板操作 103
2.5.2  關聯算法介紹 103
2.5.3  手把手教你用 106
2.6  選擇屬性 113
2.6.1  選擇屬性面板操作 114
2.6.2  選擇屬性算法介紹 114
2.6.3  手把手教你用 116
2.7  可視化 123
2.7.1  選擇單獨的2D散點圖 124
2.7.2  選擇實例 125
2.7.3  手把手教你用 125
課後強化訓練 127
第3章  Knowledge Flow界面 129
3.1  知識流介紹 130
3.1.1  知識流特性 130
3.1.2  知識流界面佈局 131
3.2  知識流組件 133
3.2.1  數據源 133
3.2.2  數據接收器 136
3.2.3  評估器 138
3.2.4  可視化器 140
3.2.5  其他工具 141
3.3  使用知識流組件 143
3.4  手把手教你用 145
課後強化訓練 162
第4章  Experimenter界面 163
4.1  簡介 164
4.2  標準實驗 165
4.2.1  簡單實驗 165
4.2.2  高級實驗 170
4.2.3  手把手教你用 177
4.3  遠程實驗 189
4.3.1  遠程實驗設置 189
4.3.2  手把手教你用 192
4.4  分析結果 199
4.4.1  獲取實驗結果 200
4.4.2  配置測試 200
4.4.3  保存結果 204
4.4.4  手把手教你用 204
課後強化訓練 208
第5章  命令行界面 209
5.1  命令行界面介紹 210
5.1.1  命令調用 211
5.1.2  命令自動完成 212
5.2  Weka結構 213
5.2.1  類實例和包 213
5.2.2  weka.core包 214
5.2.3  weka.classifiers包 215
5.2.4  其他包 216
5.3  命令行選項 216
5.3.1  常規選項 217
5.3.2  特定選項 219
5.4  過濾器和分類器選項 220
5.4.1  過濾器選項 220
5.4.2  分類器選項 223
5.4.3  手把手教你用 224
5.5  包管理器 229
5.5.1  命令行包管理器 230
5.5.2  運行安裝的算法 231
課後強化訓練 232
第6章  Weka高級應用 233
6.1  貝葉斯網絡 234
6.1.1  簡介 234
6.1.2  貝葉斯網絡編輯器 237
6.1.3  在探索者中使用貝葉斯
網絡 245
6.1.4  學習算法 246
6.1.5  查看貝葉斯網絡 248
6.1.6  手把手教你用 251
6.2  神經網絡 261
6.2.1  GUI使用 261
6.2.2  手把手教你用 263
6.3  文本分類 268
6.3.1 文本分類示例 268
6.3.2  分類真實文本 273
6.3.3  手把手教你用 274
6.4  時間序列分析及預測 280
6.4.1  使用時間序列環境 280
6.4.2  手把手教你用 291
課後強化訓練 299
第7章  Weka API 301
7.1  加載數據 302
7.1.1  從文件加載數據 302
7.1.2  從數據庫加載數據 303
7.1.3  手把手教你用 304
7.2  保存數據 309
7.2.1  保存數據至文件 309
7.2.2  保存數據至數據庫 309
7.2.3  手把手教你用 310
7.3  處理選項 313
7.3.1  處理選項方法 313
7.3.2  手把手教你用 314
7.4  內存數據集處理 315
7.4.1  在內存中創建數據集 315
7.4.2  打亂數據順序 319
7.4.3  手把手教你用 319
7.5  過濾 323
7.5.1  批量過濾 324
7.5.2  即時過濾 325
7.5.3  手把手教你用 326
7.6  分類 329
7.6.1  分類器構建 329
7.6.2  分類器評估 330
7.6.3  實例分類 332
7.6.4  手把手教你用 333
7.7  聚類 344
7.7.1  聚類器構建 345
7.7.2  聚類器評估 345
7.7.3  實例聚類 347
7.7.4  手把手教你用 347
7.8  屬性選擇 353
7.8.1  使用元分類器 354
7.8.2  使用過濾器 354
7.8.3  使用底層API 355
7.8.4  手把手教你用 356
7.9  可視化 359
7.9.1  ROC曲線 359
7.9.2  圖 360
7.9.3  手把手教你用 361
7.10  序列化 366
7.10.1  序列化基本方法 366
7.10.2  手把手教你用 367
7.11  文本分類綜合示例 369
7.11.1  程序運行準備 369
7.11.2  源程序分析 370
7.11.3  運行說明 377
課後強化訓練 379
第8章  學習方案源代碼分析 381
8.1  NaiveBayes源代碼分析 382
8.2  實現分類器的約定 401
課後強化訓練 403
附錄A  中英文術語對照 405
附錄B  Weka算法介紹 409
參考文獻 457



發佈了48 篇原創文章 · 獲贊 14 · 訪問量 6萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章