第一步:找到适合二分类Logistic的数据集
首先,我们进入机器学习数据集仓库寻找合适的数据集:http://archive.ics.uci.edu/ml/datasets.html?format=&task=cla&att=&area=&numAtt=&numIns=&type=&sort=nameUp&view=table
我们以威斯康星州乳腺癌的诊断数据作为参考数据:https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/
上面两项分别对应数据集和这些数据的介绍:
将数据Ctrl+A、Ctrl+C、Ctrl+V保存到txt里(csv也行,随便啦)
第二项关于数据的描述里,我们只关注下面的信息就好了:他告诉我们数据集每一列的含义。
第二步:将数据导入spss
这一步比较简单,直接把桌面的txt导入spss即可,如图
第三步:运行并分析结果
毫无疑问,列中的Class是判断癌症与否的因变量,只有两种可能,要么是要么否,所以他是因变量,其他都是自变量,直接点确定即可。
运行结果如下有很多表格,可以根据自己的需要得到想要的信息:
完