python 學習筆記之 使用pandas 進行簡單的數據分析(一)

1.    引入庫:import 庫名 import pandas
2.    查看pandas 版本 :pandas.__version__   (這裏是雙英文下劃線)
3.    Import  pandas as pd

#以後pd就是pandas 庫,

如果你想查看版本就可以使用pd.__version__

import pandas
pandas.__version__
#pandas 區分大小寫,version 全是小寫

執行結果


4.    查看版本的另一種方式:

import pandas as pd
pd.show_versions()

這種方式打印的版本比較詳細

使用 Tab鍵可以出現函數提示,即 

輸入pd.read 按tab鍵可以選擇函數,補足你記不住函數的劣勢

查看函數文檔

pd.函數名? 然後按shift+tab

顯示如下:

讀取本地文件:數據分析有兩種重要的數據類型,dataFrames(可以理解爲一張sheet,具有各種供你操作屬性的sheet,以後會詳細的說他的操作) 和Series
這裏是讀取爲dataFrame 

import pandas as pd
Oo = pd.read_csv('./data/olympics.csv',skiprows=4 )
#文件放在C盤。用戶文件夾下,看home就知道,具體在哪了

#第一個參數是文件的路徑 ; skiprow = 4 表示跳過前四行

執行結果如下:

如果只想 只想獲得幾行數據,可使用函數head()

Oo.head(3)
# oo.head() ,若參數爲空
# 默認打印前5行和後5行

 

Oo.head(3)
#查看數據類型
type(Oo)

 執行結果如下:

series 是一個數組,對於一個dataFrame 每一行每一列都是一個 series,是一個1維的有索引的,每一列都是有索引的 

#在一個dataFrame中提取series 的方法
Oo.City   #city 是列名---這種方式列名沒有空格
cit=Oo['City']

打印的就是city列

你可以看到他是有索引的。

下面我們來看看他是不是我們想的類型--series

type(cit)

在dataFrame 中獲取子DataFrame:

大於一列數據可以組成一個 DataFrame

#爲了確認優先級,這裏使用兩個中括號
sub = Oo[['City','Sport','Edition']]
sub.head()

來看一下數據類型

sub = Oo[['City','Sport','Edition']]
type(sub)

sub.tail()
#打印sub的後5行,與head 類似

 

 

#查看sheet表的行數和列數
Oo.shape
#shape是一個屬性,不是函數,其返回值是一個數組(row,column)
Oo.shape[0] #返回行數
Oo.shape[1] #返回列數

# 獲取 dataFrame 的信息
Oo.info()

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章