Apriori算法與項目實戰
上一篇:人工神經網絡
1、關聯分析概述
2、Apriori算法
3、使用Apriori算法實現課程關聯分析
# -*- coding: utf-8 -*-
# --------------------------------------
# @Time : 2019/10/25 16:28
# @Author : hxf
# @Email : [email protected]
# @File : lesson.py
# Description :使用Apriori算法實現課程關聯分析
# ----------------------------------
'''
使用Apriori算法實現課程關聯分析
'''
#計算學院購買課程的關聯性
from apriori import *
import pandas as pd
# 導入數據
filename="data/lesson_buy.xls"
dataframe=pd.read_excel(filename,header=None)
# print(dataframe)
# 轉化一下數據
dataframe=pd.read_excel(filename,header=None)
#轉化一下數據
change=lambda x:pd.Series(1,index=x[pd.notnull(x)])
mapok=map(change,dataframe.values)
data=pd.DataFrame(list(mapok)).fillna(0)
print(data)
#臨界支持度、置信度設置
spt=0.2
cfd=0.5
#使用apriori算法計算關聯結果
find_rule(data,spt,cfd,"-->")
'''
D:\software\Anaconda3\python.exe F:/Projects/Python/Python3_Data_Analysis/lesson.py
Python爬蟲 機器學習 數據分析 PHP Spark Java
0 1.0 1.0 1.0 1.0 1.0 1.0
1 0.0 1.0 0.0 1.0 1.0 1.0
2 1.0 0.0 0.0 0.0 0.0 0.0
3 1.0 0.0 1.0 0.0 0.0 0.0
4 1.0 1.0 1.0 0.0 0.0 0.0
5 0.0 0.0 1.0 0.0 0.0 0.0
6 1.0 1.0 0.0 0.0 0.0 0.0
7 1.0 0.0 0.0 0.0 1.0 1.0
8 0.0 0.0 1.0 1.0 0.0 1.0
9 1.0 1.0 0.0 0.0 0.0 0.0
正在進行第1次搜索...
數目:15...
正在進行第2次搜索...
數目:2...
結果爲:
support confidence
PHP-->Java 0.3 1.000000
Spark-->Java 0.3 1.000000
機器學習-->Python爬蟲 0.4 0.800000
Java-->PHP 0.3 0.750000
Java-->Spark 0.3 0.750000
數據分析-->Python爬蟲 0.3 0.600000
Python爬蟲-->機器學習 0.4 0.571429
Process finished with exit code 0
'''