1. 引入庫:import 庫名 import pandas
2. 查看pandas 版本 :pandas.__version__ (這裏是雙英文下劃線)
3. Import pandas as pd
#以後pd就是pandas 庫,
如果你想查看版本就可以使用pd.__version__
import pandas
pandas.__version__
#pandas 區分大小寫,version 全是小寫
執行結果
4. 查看版本的另一種方式:
import pandas as pd
pd.show_versions()
這種方式打印的版本比較詳細
使用 Tab鍵可以出現函數提示,即
輸入pd.read 按tab鍵可以選擇函數,補足你記不住函數的劣勢
查看函數文檔
pd.函數名? 然後按shift+tab
顯示如下:
讀取本地文件:數據分析有兩種重要的數據類型,dataFrames(可以理解爲一張sheet,具有各種供你操作屬性的sheet,以後會詳細的說他的操作) 和Series
這裏是讀取爲dataFrame
import pandas as pd
Oo = pd.read_csv('./data/olympics.csv',skiprows=4 )
#文件放在C盤。用戶文件夾下,看home就知道,具體在哪了
#第一個參數是文件的路徑 ; skiprow = 4 表示跳過前四行
執行結果如下:
如果只想 只想獲得幾行數據,可使用函數head()
Oo.head(3)
# oo.head() ,若參數爲空
# 默認打印前5行和後5行
Oo.head(3)
#查看數據類型
type(Oo)
執行結果如下:
series 是一個數組,對於一個dataFrame 每一行每一列都是一個 series,是一個1維的有索引的,每一列都是有索引的
#在一個dataFrame中提取series 的方法
Oo.City #city 是列名---這種方式列名沒有空格
cit=Oo['City']
打印的就是city列
你可以看到他是有索引的。
下面我們來看看他是不是我們想的類型--series
type(cit)
在dataFrame 中獲取子DataFrame:
大於一列數據可以組成一個 DataFrame
#爲了確認優先級,這裏使用兩個中括號
sub = Oo[['City','Sport','Edition']]
sub.head()
來看一下數據類型
sub = Oo[['City','Sport','Edition']]
type(sub)
sub.tail()
#打印sub的後5行,與head 類似
#查看sheet表的行數和列數
Oo.shape
#shape是一個屬性,不是函數,其返回值是一個數組(row,column)
Oo.shape[0] #返回行數
Oo.shape[1] #返回列數
# 獲取 dataFrame 的信息
Oo.info()