原创 推薦引擎之Mahout 基於用戶協同過濾算法的使用
本文目的: 介紹一種常見推薦算法(用戶協同過濾)的使用。應用場景: XXX項目運行一段時間後,系統中將會存在很多視頻信息, 而通常 APP 給用戶推送的消息(1-3條/每天),那麼這就需要我們根據用戶的行爲特徵,進行更爲有效的推送。 工具介
原创 百度地圖基於範圍的搜索---筆記
應用場景描敘: 假設數據庫中有一個商家的table,裏面記錄了一些商家的基本信息和座標,那麼如何在自己的APP中,通過定位,利用百度地圖快速查找指定區域內符合條件的商家?以下是java 代碼的實現: /** * 百度地圖
原创 mahout 常見機器學習算法及分類
最近一直在學習hadoop 一直沒有梳理接觸到的東西,常見算法分類:推薦系統(推薦引擎):基於用戶的協同過濾算法UserCF 近鄰算法,容易實現基於物品的協同過濾算法ItemCF 速度快,容易實現分佈式計算SlopeO
原创 關於IP純真數據庫(QQWry.dat)的使用 ----筆記
在用 Hadoop 分析 網站 kpi 指數的時候,需要把IP 轉換成地區,來進行用戶來源分析,百度了一下,發現這個好用,mark 一下。另外,淘寶的也提供了ip地址查詢的API,也比較好用,具體可參考鏈接具體代碼見附件,測試代碼如下:pu
原创 Mahout 常用相似度度量(筆記)
Mahout 基於推薦系統,分類,聚類算法 等經常用到的相似度度量:PearsonCorrelationSimilarity 皮爾森距離EuclideanDistanceSimilarity 歐幾里德距離CosineMeasureSimil
原创 Eclipse luna Subversive(SVN) 的安裝----note
安裝過程分爲兩步:1 Subversive Plug in 的安裝Help--->Install New Soft ----> 輸入 “Luna - http://download.eclipse.org/releases/luna”這裏
原创 關於矩陣計算的java 代碼實現----筆記
最近學習hadoop, 很多算法需要利用到矩陣計算,,例如: 協同過濾,pagerank 等等所以練習一下, public static void m1() { // 根據矩陣乘法的規則,a[4 *3] * b[3,2], //
原创 關於 CheckStyle 的使用 ( Eclipse 插件 )
1.下載eclipse插件http://sourceforge.net/projects/eclipse-cs/下載後,把裏面的兩個文件夾plugins和 features下面的文件分別拷貝到eclipse目錄下面對應的plugins和f
原创 Hadoop(1.2.1) 常用配置-------筆記
core-site.xml<configuration> <property> <name>fs.default.name</name> <value>hdfs://qlserver03:9000</value> <