機器學習數據集pima-indians-diabetes.data 及R語言讀入命令

這個數據集是機器學習常用練習集,包括768個observation,原鏈接如下

https://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/

已經失效,原因是permission restriction。

從網上搜索到了數據集的內容,並將其轉換爲tab分隔的文本文件。

主要參考了CSDN博主 姜萌芽 的博文 

文件已上傳至共享資源,鏈接在此 https://download.csdn.net/download/lf94lf94/11828795

各列數據說明如下:

文件默認是5積分下載, 問下各位如何設成免費下載

也可留言免費發送

或者參考博文,用VIM等自行編輯,樂趣自在其中

R語言可以用如下命令讀取並命名header:

diabetes <- read.table(file=“pima-indians-diabetes.data”, sep="\t", header=FALSE) 
names(diabetes) <- c("npregant", "glucose", "BP", "triceps", 
                     "insulin", "bmi", "pedigree", "age", "class") 
diabetes$class <- factor(diabetes$class, levels=c(0,1), 
                         labels=c("normal", "diabetic")) 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章