這個數據集是機器學習常用練習集,包括768個observation,原鏈接如下
https://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/
已經失效,原因是permission restriction。
從網上搜索到了數據集的內容,並將其轉換爲tab分隔的文本文件。
主要參考了CSDN博主 姜萌芽 的博文
文件已上傳至共享資源,鏈接在此 https://download.csdn.net/download/lf94lf94/11828795。
各列數據說明如下:
文件默認是5積分下載, 問下各位如何設成免費下載?
也可留言免費發送。
或者參考博文,用VIM等自行編輯,樂趣自在其中
R語言可以用如下命令讀取並命名header:
diabetes <- read.table(file=“pima-indians-diabetes.data”, sep="\t", header=FALSE) names(diabetes) <- c("npregant", "glucose", "BP", "triceps", "insulin", "bmi", "pedigree", "age", "class") diabetes$class <- factor(diabetes$class, levels=c(0,1), labels=c("normal", "diabetic"))