原创 推薦引擎之Mahout 基於用戶協同過濾算法的使用

本文目的: 介紹一種常見推薦算法(用戶協同過濾)的使用。應用場景: XXX項目運行一段時間後,系統中將會存在很多視頻信息, 而通常 APP 給用戶推送的消息(1-3條/每天),那麼這就需要我們根據用戶的行爲特徵,進行更爲有效的推送。 工具介

原创 百度地圖基於範圍的搜索---筆記

應用場景描敘: 假設數據庫中有一個商家的table,裏面記錄了一些商家的基本信息和座標,那麼如何在自己的APP中,通過定位,利用百度地圖快速查找指定區域內符合條件的商家?以下是java 代碼的實現:    /**      * 百度地圖  

原创 mahout 常見機器學習算法及分類

最近一直在學習hadoop 一直沒有梳理接觸到的東西,常見算法分類:推薦系統(推薦引擎):基於用戶的協同過濾算法UserCF      近鄰算法,容易實現基於物品的協同過濾算法ItemCF       速度快,容易實現分佈式計算SlopeO

原创 關於IP純真數據庫(QQWry.dat)的使用 ----筆記

在用 Hadoop 分析 網站 kpi 指數的時候,需要把IP 轉換成地區,來進行用戶來源分析,百度了一下,發現這個好用,mark 一下。另外,淘寶的也提供了ip地址查詢的API,也比較好用,具體可參考鏈接具體代碼見附件,測試代碼如下:pu

原创 Mahout 常用相似度度量(筆記)

Mahout 基於推薦系統,分類,聚類算法 等經常用到的相似度度量:PearsonCorrelationSimilarity 皮爾森距離EuclideanDistanceSimilarity 歐幾里德距離CosineMeasureSimil

原创 Eclipse luna Subversive(SVN) 的安裝----note

安裝過程分爲兩步:1  Subversive Plug in 的安裝Help--->Install New Soft ----> 輸入 “Luna - http://download.eclipse.org/releases/luna”這裏

原创 關於矩陣計算的java 代碼實現----筆記

最近學習hadoop, 很多算法需要利用到矩陣計算,,例如: 協同過濾,pagerank 等等所以練習一下, public  static void m1() { // 根據矩陣乘法的規則,a[4 *3]  * b[3,2], //

原创 關於 CheckStyle 的使用 ( Eclipse 插件 )

 1.下載eclipse插件http://sourceforge.net/projects/eclipse-cs/下載後,把裏面的兩個文件夾plugins和 features下面的文件分別拷貝到eclipse目錄下面對應的plugins和f

原创 Hadoop(1.2.1) 常用配置-------筆記

core-site.xml<configuration>   <property>     <name>fs.default.name</name>     <value>hdfs://qlserver03:9000</value>   <