Apriori算法與項目實戰


上一篇:人工神經網絡

1、關聯分析概述

關聯分析
Apriori關聯分析算法概述

2、Apriori算法

Apriori算法總結

3、使用Apriori算法實現課程關聯分析

# -*- coding: utf-8 -*-
# --------------------------------------
# @Time    : 2019/10/25 16:28
# @Author  : hxf
# @Email   : [email protected]
# @File    : lesson.py
# Description :使用Apriori算法實現課程關聯分析
# ----------------------------------
'''
使用Apriori算法實現課程關聯分析
'''
#計算學院購買課程的關聯性
from apriori import *
import pandas as pd

# 導入數據
filename="data/lesson_buy.xls"
dataframe=pd.read_excel(filename,header=None)
# print(dataframe)

# 轉化一下數據
dataframe=pd.read_excel(filename,header=None)
#轉化一下數據
change=lambda x:pd.Series(1,index=x[pd.notnull(x)])
mapok=map(change,dataframe.values)
data=pd.DataFrame(list(mapok)).fillna(0)
print(data)

#臨界支持度、置信度設置
spt=0.2
cfd=0.5

#使用apriori算法計算關聯結果
find_rule(data,spt,cfd,"-->")
'''
D:\software\Anaconda3\python.exe F:/Projects/Python/Python3_Data_Analysis/lesson.py
   Python爬蟲  機器學習  數據分析  PHP  Spark  Java
0       1.0   1.0   1.0  1.0    1.0   1.0
1       0.0   1.0   0.0  1.0    1.0   1.0
2       1.0   0.0   0.0  0.0    0.0   0.0
3       1.0   0.0   1.0  0.0    0.0   0.0
4       1.0   1.0   1.0  0.0    0.0   0.0
5       0.0   0.0   1.0  0.0    0.0   0.0
6       1.0   1.0   0.0  0.0    0.0   0.0
7       1.0   0.0   0.0  0.0    1.0   1.0
8       0.0   0.0   1.0  1.0    0.0   1.0
9       1.0   1.0   0.0  0.0    0.0   0.0

正在進行第1次搜索...
數目:15...

正在進行第2次搜索...
數目:2...

結果爲:
                 support  confidence
PHP-->Java           0.3    1.000000
Spark-->Java         0.3    1.000000
機器學習-->Python爬蟲      0.4    0.800000
Java-->PHP           0.3    0.750000
Java-->Spark         0.3    0.750000
數據分析-->Python爬蟲      0.3    0.600000
Python爬蟲-->機器學習      0.4    0.571429

Process finished with exit code 0

'''
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章