原创 對天氣數據進行簡單的數據分析

用到的數據是在某地級市政府網站獲取的公開數據,現以天氣數據爲例進行簡單的數據分析 初始數據以xlsx格式儲存:    初始的數據格式對於後續分析來說不太友好,我希望數據能夠具有原子性,所以接下來利用excel自帶的功能對數據進行整理,利

原创 R語言-plyr包中的函數

plyr包集中體現了“分離-操作-結合”的數據操作理念。 plyr的核心函數由ddply、llply、laply函數組成,所有的函數名均由五個字母組成且最後三個字母都爲ply。函數名的第一個字母代表輸入值的類型,第二個字母代表輸出值的類型

原创 利用Rstudio對考試成績進行數據分析

首先導入數據到Rstudio中 使用read.csv()函數 scores nrow(scores) [1] 599 ncol(scores) [1] 12   在scores的所有列中,num和class兩列與成績沒有太大的關係

原创 R語言——決策樹模型

        決策樹(Tree Nodels)是一種創建樹狀模型的方法,它使用‘基尼不純度’(Gini Impurity)或信息增益(Information Gain)等標準對節點進行遞歸分割,以創建樹狀模型。決策樹看起來像是以樹狀形式

原创 [Python]爬拉鉤(Python職位)

import requests from bs4 import BeautifulSoup import time import random #header裏面加上cookie防止被ban def getHTMLText(url,en