原创 Spark 好友推薦解決方案

目標:如果用戶A與用戶C同時都跟B是好友,但用戶A與用戶C又不是好友,則向用戶A推薦C,向用戶C推薦A,同時說明A與C的共同好友有哪些 例如: 有如下的好友關係: 1 2,3,4,5,6,7,8 2 1,3,4,5,7 3 1,2

原创 Hadoop/MapReduce 及 Spark KMeans聚類算法實現

package kmeans; import java.io.BufferedReader; import java.io.DataInput; import java.io.DataOutput; import java.io.Fil

原创 Hadoop/MapReduce 好友推薦解決方案

目標:如果用戶A與用戶C同時都跟B是好友,但用戶A與用戶C又不是好友,則向用戶A推薦C,向用戶C推薦A,同時說明A與C的共同好友有哪些 例如: 有如下的好友關係: 1 2,3,4,5,6,7,8 2 1,3,4,5,7 3 1,2 4 1

原创 Hadoop/MapReduce 及 Spark KNN分類算法實現

KNN 假如有一羣已知分類的點集: //S.txt 100;c1;1.0,1.0 101;c1;1.1,1.2 102;c1;1.2,1.0 103;c1;1.6,1.5 104;c1;1.3,1.7 105;c1;2.0,2.1 10

原创 Hadoop/MapReduce、Spark 樸素貝葉斯分類器分類符號數據

package cjbayesclassfier; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.ap

原创 圖形數據庫Neo4j入門

一、安裝 官網下載,https://neo4j.com 二、Neo4j的查詢語言Cypher的基本使用 1、CREATE (you:Person {name:"chenjie"}) RETURN you 2、MATCH (

原创 消息隊列系列之分佈式消息隊列Kafka

介紹 ApacheKafka®是一個分佈式流媒體平臺。這到底是什麼意思呢? 我們認爲流媒體平臺具有三個關鍵功能: 它可以讓你發佈和訂閱記錄流。在這方面,它類似於消​​息隊列或企業消息傳遞系統。它允許您以容錯方式存儲記錄流。它可以讓您

原创 Spark 共同好友解決方案:求大量集合的兩兩交集

Hadoop/MapReduce 共同好友解決方案:求大量集合的兩兩交集 import org.apache.spark.SparkConf import org.apache.spark.SparkContext import

原创 Spark購物籃分析:關聯規則挖掘

1、淺談數據挖掘中的關聯規則挖掘 2、Hadoop/MapReduce購物籃分析:關聯規則挖掘 3、Spark購物籃分析 過程分析: import org.apache.spark.SparkConf import org.a

原创 Spark移動平均:時間序列數據平均值

一、內存排序 import org.apache.spark.SparkConf import org.apache.spark.SparkContext object MovingAverageInMemory { def

原创 消息隊列系列之ActiveMQ(JMS、集羣配置)

1、ActiveMQ的下載與啓動 到http://activemq.apache.org/activemq-5152-release.html下載ActiveMQ windows版本的啓動: 運行bin文件夾中的win32(32位系統)/

原创 Hadoop/MapReduce移動平均:時間序列數據平均值

例子1:時間序列數據(股票價格) 對於如下的收盤價序列數據: 時間序列 日期 收盤價 1 2013-10-01 10 2 2013-10-02 18 3 2013-10-03 20 4 2013-10-04 3

原创 Hadoop/MapReduce 使用馬爾可夫模型的智能郵件營銷

目的:用戶的購買行爲看起來是沒有規律可循的,但其實從時間有序的角度看,也許是有規律可循的,例如,用戶可能每一個月發工資時購買得多,每年某個時間(雙十一、生日)等購買得比較多 馬爾科夫模型能夠挖掘出時間上的規律,假設我們能夠根據用戶上一次購

原创 Hadoop/MapReduce 共同好友解決方案:求大量集合的兩兩交集

共同好友:求大量集合的兩兩交集 目標:令U爲包含所有用戶的一個集合:{U1,U2,...,Un},我們的目標是爲每個(Ui,Uj)對(i!=j)找出共同好友。 前提:好友關係是雙向的 輸入:<person><,><friend1>< >

原创 Hadoop/MapReduce 查找、統計和列出大圖中的所有三角形

package cjtriangle; import java.io.IOException; import java.util.ArrayList; import java.util.Iterator; import java.