關聯規則:Association Rule
關聯規則是反應失誤與實物間相互的依存關係和關聯性。如果兩個或多個事物間存在一定的關聯關係,則其中一個事物能夠通過其他食物預測到。最常見的場景就是購物籃分析(Market Basket)。通過分析顧客購物籃中的不同商品之間關係,來分析顧客的購買習慣。經典案例就是啤酒和尿布。
先看一個栗子,有某超市的購物籃信息,以此分析顧客的購物習慣,制定貨物擺放或者捆綁銷售策略。(Apriori)
第一步,首先確定最小支持度:50%,最小置信度:50%
第二步,確定1- 頻繁項集
該1- 項集中 { D } 不滿足最小支持度要求,所以1- 頻繁項集爲:
第三步,確定2- 頻繁項集(2-項集由1-頻繁項集組合而得)
同樣我們剔除掉不滿足支持度的記錄,得到2- 頻繁項集:
第三步,確定3- 頻繁項集(3-項集由2-頻繁項集組合而得)
其中 {A,B,C,E} 不是3項集,同時淘汰小於支持度的記錄,得到的3- 頻繁項集爲:
第四步,確定關聯規則,即爲最終頻繁項集的非空子集之間關聯
比如,買了非空子集{ C, E} 的 買 非空子集 { B} 的支持度爲 50%(原始數據中有兩條記錄)。
最終關聯規則也就是: