兩種找頻繁項集的方法

兩種找頻繁項集的方法

Apariori算法:主要通過限制候選產生髮現頻繁項集
使用的是頻繁項集的先驗原理
是一種稱爲逐層搜索的迭代方法,其中k項集用於搜索(k+1)項集
使用步驟:
1、掃描數據庫,累計每個項的計數,並收集滿足最小支持度的項,找到頻繁1項集 L1
2、使用L1&L2產生候選2項集C2
3,C2計數、
4、剪枝(根據最小支持度)

FP樹表示法
自底向上方式探索樹
逐個讀入事務,並把每個事務映射到FP樹中一條路徑來構造,路徑重疊時,重疊越多,使用FP樹結構獲得的壓縮效果就越好,
步驟:
1.根據最小支持度找底節點的頻繁項集
2.通過頻繁項集結點處理與之相關的結點
3,逐層查找,小於最小支持度的排除

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章