Apriori算法簡介

本博客不再更新,更多精彩內容請訪問我的獨立博客

Apriori算法
Apriori算法步驟:

1.Apriori算法:使用候選項集找頻繁項集
2.由頻繁項集產生關聯規則

例:設A=足球服,B=足球鞋, C=足球。某網上商城的銷售情況如下:

客戶號

客戶

商品

數量

C1

李鳴

足球服A

10

C1

李鳴

足球鞋B

8

C1

李鳴

足球C

60

C2

金珊

足球C

20

C3

馮君

足球服A

50

C3

馮君

足球鞋B

60

C4

丁貝

足球鞋B

20

C5

陳騁

足球服A

30

不關心商品的銷量,只關心商品間的關聯度

基本概念
支持度 :    設W 中有s %的事務同時支持物品集A 和B,s %稱爲關聯規則A→B 的支持度。
   例如:A的支持度=60%          A→B 的支持度 = 40%

  Apriori算法:找頻繁項集:
1、在第一輪循環中,所有1項目(只有1項)集是候選項目集,從中篩選出
支持度>最小支持度的項目放入頻繁項目集
2、在第二輪循環中,只有頻繁1項目組成的2項目纔是候選項目,從中篩選出
支持度>最小支持度的2項目放入頻繁項目集。
3、繼續循環,直至n輪循環,所有的頻繁項目選出,頻繁項目集形成。

設最小支持度爲30%
(1)1項目候選項:A 、     B  、 C
                   
  支持度: 60%       60%       40%
          所以頻繁項目集:    進入下一輪單項:
          {A 、B、C}                {A 、B、C}
22項目候選項:AB 、BC、AC
                   
      支持度:40%   20%   20%
          所以頻繁項目集:        進入下一輪單項:
          {A 、B、C、AB}         {A, B}
(3)3項目候選項:無
         
算法終止
所以頻繁項目集:
         
{A 、B、C、AB}
由頻繁項集產生關聯規則

頻繁項目

支持度

頻繁項目

支持度

A

60%

C

40%

B

60%

AB

40


可信度:它是針對規則而言的。指在出現了物品集A 的事務T 中,物品集B 也同時出現的概率有多大。
       可信度=p(condition and result)/p(condition)
興趣度:物品集A 的出現對物品集B 的出現有多大的影響。 
興趣度=p(condition and result)/p(condition)*p(result)。
——當興趣度大於1的時候,這條規則就是比較好的;
——當興趣度小於1的時候,這條規則就是沒有很大意義的。
例: 規則1:if  A   THEN  B , 可信度?
可信度= (A和B)/ A = 40% / 60% = 67% 
規則2:if  A   THEN  C , 可信度?
可信度= (A和C)/ A = 20% / 60% = 33%

規則3:if  A   THEN  B , 興趣度?
興趣度=  (A和B)/  (A*B) =  40% / (60% * 60%)= 1.11 > 1  有意義

規則4:if  A   THEN  C , 興趣度?
興趣度=  (A和C)/  (A*C) =  20% / (60% * 40%)= 0.83 < 1



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章