FP-growth算法簡介及特點
這個算法只進行2次數據庫掃描。
它不使用侯選集,直接壓縮數據庫成一個頻繁模式樹,最後通過這棵樹生成關聯規則。
算法的最大特點是不需要產生候選項集,大大提高了挖掘效率。
FP-growth算法的基本思路
FP樹構造
爲了方便遍歷FP樹,爲FP樹創建一個項頭表,項頭表中每一行表示一個1-頻繁項,並有一個指針指向它在FP樹中的結點。
FP樹中所有相同頻繁項的結點通過指針連成一個鏈表。
從FP樹可以看出,包含某個1-頻繁項的所有可能的頻繁項集可以通過這個鏈表搜索到。
實例