關聯規則數據的構建是實施算法的前提,在查閱大量的資料之後,也沒有找到能講得清晰的數據構建過程,以下數據的構建是本人對於數據的構建,僅供參考。
以下案例僅僅針對,類似“每一行代表一個用戶購買一個商品”。
> x <- data.frame(item=c('a','b','a','b','c'),user=c('1','1','2','2','2'))
> x
item user
1 a 1
2 b 1
3 a 2
4 b 2
5 c 2
# 利用xtabs()做onehot
> y <- xtabs(~ item + user,x)
# 將xtabs轉化爲matrix
> y <- as.data.frame.matrix(y)
> y <- as.matrix(y)
> class(y)
# 將matrix的結果轉化爲transactions
> yy <- as(y, "transactions")
# 查看結果
> inspect(yy)
items transactionID
[1] {1,2} a
[2] {1,2} b
[3] {2} c
ok!結果是我想要的。