最小支持度、最小置信度、顯著性

置信度=在事務中已經包含X的情況下包含Y的百分比;

支持度=事務中同時包含X、Y的百分比;

下面看一個三級數據庫題庫的真題吧

1)以下是某商場的購物記錄集合,每個購物籃中包含若干商品。現在要基於該數據集進行關聯規則挖掘,如果設置最小支持度爲60%,

最小置信度爲80%,則在以下列出的關聯規則中,符合條件的是()。

由表中可以看出,

事務中同時包含C,D的支持度爲3/5=60%;

在包含D的情況下包含C的置信度爲3/3=100%;

所以這個題也就不難看出答案啦,選D;

 

·對於置信度一般我們會說'……實驗結果落在某個置信區間的可能性可以達到多高……'(這個可能性越大置信度就越高)

· 而對於顯著性我們會說'……我們的理論假設被否定的可能性小於多少,我們的假設就可以被稱爲顯著或者極顯著……'(這個可能性越小顯著性越高)

也就是說,置信度通常是正面描述(拒僞的),而且通常需要與一個置信區間關聯起來。而顯著性則是反面描述(拒真的),而且通常需要與一個預設的判斷門檻值聯繫起來。

參數顯著的,就是說該參數估計量的統計性質可以拒絕原假設:該參數=0,即該參數顯著不等於0,也就是該參數前面的變量對y確實有影響,出現在迴歸方程裏面是有道理的。
參數的顯著性,是實證模型有意義的關鍵所在。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章