關聯規則筆記

關聯規則筆記:
如記錄的集合D中有記錄A以及記錄B。記錄A推記錄B(關聯規則)
支持度:記錄A和記錄B同時出現佔總個數比例。
置信度:記錄A中出現記錄B的個數比例。
如果挖掘的關聯規則滿足最小的支持度閾值和最小置信度的閾值,則關聯規則是有趣的。
重要性:頻繁項集的所有非空子集都必須是頻繁的。

Apriori算法思想:
逐層搜索的迭代方法,
首先尋找1-項頻繁集的集合,
集合記做L1,
L1用於尋找兩項頻繁集合L2,
L2用於尋找L3,如此下去,直到不能找K項頻繁集合。

Apriori算法迭代的兩個階段:
?1連接步;爲找L(k) ,通過將L(k-1)與自身連接產生候選K項集的集合。
2減枝步;根據項的支持度計數去掉非頻繁的候選集合,確定頻繁集反覆迭代直到不能產生滿足最小支持度的集合爲止。
Apriori重要性質:頻繁項集的所有非空子集都必須是頻繁的在減枝中的應用就在於,對於候選集只要它不是頻繁的,就可以刪除掉,這樣大大減少數據量。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章