FP-growth算法

FP-growth算法簡介及特點

這個算法只進行2次數據庫掃描。
它不使用侯選集,直接壓縮數據庫成一個頻繁模式樹,最後通過這棵樹生成關聯規則。
算法的最大特點是不需要產生候選項集,大大提高了挖掘效率。

FP-growth算法的基本思路

這裏寫圖片描述

FP樹構造

這裏寫圖片描述

爲了方便遍歷FP樹,爲FP樹創建一個項頭表,項頭表中每一行表示一個1-頻繁項,並有一個指針指向它在FP樹中的結點。
 FP樹中所有相同頻繁項的結點通過指針連成一個鏈表。
 從FP樹可以看出,包含某個1-頻繁項的所有可能的頻繁項集可以通過這個鏈表搜索到。

實例

這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章