mahout源碼研究--參考資料

(一)UML知識:
在研究mahout源碼時,需要用到UML來梳理清楚源碼類之間的關係。

(二)參考資料目錄
apache Mahout CookBook目錄
1.Mahout並沒有如此的難
    1.1Java和hadoop安裝
    1.2安裝一個Maven和NetBeans開發環境
    1.3.編寫一個基本的推薦引擎
2.什麼時候,爲什麼要使用序列化文件
    2.1介紹
    2.2通過命令行創建序列文件
    2.3通過代碼生成序列文件
    2.4通過代碼讀序列文件
3.用外部數據源整合mahout
    3.1介紹
    3.2將外部數據源導入到HDFS
    3.3將數據從HDFS導入的RDBMS
    3.4創建一個Sqoop Job來處理RDBMS
    3.5使用Sqoop API導入數據
4.Mahout中實現樸素貝葉斯分類
    4.1介紹
    4.2使用Mahout文本分類來驗證
    4.3通過代碼來使用樸素貝葉斯分類
    4.4通過代碼來實現互補的樸素貝葉斯分類
    4.5編寫互補的樸素貝葉斯分類器
5.用Mahout來預測股市趨勢
    5.1介紹
    5.2準備Logistic迴歸數據
    5.3通過Logistic迴歸數據預測GOOG走向
    5.4在Java代碼中使用合適的Logistic迴歸數據
    5.5使用隨機森林來預測股票走向
6.Mahout中Canopy聚類
    6.1介紹
    6.2基於命令行的Canopy聚類
    6.3基於命令行帶參數的Canopy聚類
    6.4Java實現Canopy聚類
    6.5編寫自己聚類距離評估算法
7.Mahout中譜聚類
    7.1介紹
    7.2通過命令行使用EigenCuts
    7.3通過Java代碼使用EigenCuts
    7.4通過原始數據來創建一個相似矩陣
    7.5圖像分割中使用譜聚類
8.K-means聚類
    8.1介紹
    8.2通過Java代碼來使用K-means聚類
    8.3使用K-means聚類交通事故
    8.4通過命令行使用K-means聚類
9.用Mahout進行軟件計算
    9.1介紹
    9.2用Mahout進行頻繁項集挖掘
    9.3爲頻繁項集挖掘創建度量
    9.4通過Java代碼使用頻繁項集挖掘
    9.5通過LDA創建主題
10.Mahout中實現遺傳算法
    10.1介紹
    10.2爲GA安裝Mahout
    10.3在圖中使用遺傳算法
    10.4通過Java代碼使用遺傳算法

Mahout in action目錄
    第1章 初識Apache Mahout
        1.1Mahout的故事
        1.2Mahout的機器學習主題
        1.3通過Mahouth和Hadoop來應對海量數據處理
        1.41安裝Mahout
        1.5總結
第一部分:推薦
    第2章    介紹推薦系統
    第3章    推薦系統數據描述
    第4章    做推薦
    第5章    把推薦系統轉換成產品
    第6章    分佈式推薦計算
第二部分:聚類
    第7章    聚類介紹
    第8章    數據描述
    第9章    Mahout中的聚類算法
    第10章    評估和改善聚類效果
    第11章    將聚類轉換成產品
    第12章    聚類在真實世界的應用
第三部分:分類
    第13章    分類介紹
    第14章    分類器訓練
    第15章    分類器評估和調優
    第16章    部署一個分類器
    第17章    案例學習:爲我購物
附錄A:JVM調優
附錄B:Mahout數學類
    B.1 容器
    B.2 Matrices
    B.3 Mahout數學和Hadoop
只翻譯了下兩本mahout權威書籍的目錄,這樣方便自己有需要可以快速找到相關章節去仔細研究!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章