關聯規則數據構建

關聯規則數據的構建是實施算法的前提,在查閱大量的資料之後,也沒有找到能講得清晰的數據構建過程,以下數據的構建是本人對於數據的構建,僅供參考。

以下案例僅僅針對,類似“每一行代表一個用戶購買一個商品”。

> x <- data.frame(item=c('a','b','a','b','c'),user=c('1','1','2','2','2'))

> x
  item user
1    a    1
2    b    1
3    a    2
4    b    2
5    c    2

# 利用xtabs()做onehot
> y <- xtabs(~ item + user,x)
# 將xtabs轉化爲matrix
> y <- as.data.frame.matrix(y)
> y <- as.matrix(y)
> class(y)

# 將matrix的結果轉化爲transactions
> yy <- as(y, "transactions") 

# 查看結果

> inspect(yy)
    items transactionID
[1] {1,2} a            
[2] {1,2} b            
[3] {2}   c   

ok!結果是我想要的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章