原创 Mahout in Action 學習---基於物品的分佈式推薦算法(Wikipedia數據集)

文字總結自《Mahout in Action》中文版第六章的內容 1.1 數據集介紹 Wikipedia數據集:一篇文章到另外一篇文章的鏈接。 可以將文章看作是用戶,將該文章指向的文章視爲該源文章所喜歡的物品。 類型:單向布爾型偏好。

原创 上下文感知推薦系統

在推薦系統領域,人們往往只關注“用戶-項目”之間的關聯關係,而較少考慮它們所處的上下文環境(如時間、位置、周圍人員、情緒、活動狀態、網絡條件等等)。但是在許多應用場景下,僅僅依靠"用戶-項目"二元關係並不能生成有效推薦。例如,有的用戶更

原创 推薦算法入門

推薦算法大致可以分爲以下幾類 基於流行度的算法 協同過濾算法(user-based CF and item-based CF) 基於內容的算法(content-based) 基於模型的算法 混合算法 1. 基於流行度的算法 可以按照一

原创 一種融合異構信息網絡和評分矩陣的推薦新算法

《計算機研究與發展》2014年的文章 文章摘要:在當今的大數據時代,推薦系統是解決信息超載的有效手段.傳統的協同過濾推薦系統僅僅使用用戶-項目評分矩陣,而異構信息網絡的出現爲推薦系統更多地融合用戶與項目信息提供了機遇。 1. 對推薦系

原创 MapReduce 學習日誌之我的MapReduce程序學習

  將一批電話通信清單,記錄了用戶A撥打用戶B的記錄,需要做一個倒排索引,記錄撥打給用戶B的所有用戶A。如 原有的txt 爲:   首先,我們應該把源文件傳到Hdfs上,然後將原始數據進行分割,將被叫作爲KEY,主叫作爲Value,將撥打

原创 推薦系統論文總結

一種融合PageRank的協同過濾帖子推薦方法 融合用戶評論行爲的PageRank算法來判斷一個用戶的重要性,然後將PageRank得分高的用戶作爲聚類中心計進行K-means聚類。然後通過協同過濾算法計算相似度,並結合用戶的PageRa