第一步:找到適合二分類Logistic的數據集
首先,我們進入機器學習數據集倉庫尋找合適的數據集:http://archive.ics.uci.edu/ml/datasets.html?format=&task=cla&att=&area=&numAtt=&numIns=&type=&sort=nameUp&view=table
我們以威斯康星州乳腺癌的診斷數據作爲參考數據:https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/
上面兩項分別對應數據集和這些數據的介紹:
將數據Ctrl+A、Ctrl+C、Ctrl+V保存到txt裏(csv也行,隨便啦)
第二項關於數據的描述裏,我們只關注下面的信息就好了:他告訴我們數據集每一列的含義。
第二步:將數據導入spss
這一步比較簡單,直接把桌面的txt導入spss即可,如圖
第三步:運行並分析結果
毫無疑問,列中的Class是判斷癌症與否的因變量,只有兩種可能,要麼是要麼否,所以他是因變量,其他都是自變量,直接點確定即可。
運行結果如下有很多表格,可以根據自己的需要得到想要的信息:
完