Python 使用 pandas 進行數據分析

# -*- coding: utf-8 -*-

import pandas as pd
import matplotlib.pyplot as plt

# 讀取xx.csv
# header 指明第幾行是字段行,默認爲0
# encoding 指定編碼格式,默認爲utf-8
df = pd.read_csv("people.csv", header=1, encoding='gbk')

print(df)
# 每列的數據格式
print(df.dtypes)
# 某一列
print(df['name'])

# 設置索引在圖表中爲y軸,默認爲行號,從0開始遞增
df = df.set_index('id')

# 排序
# by 指定排序所依據的字段
# ascending 指定是否升序
df = df.sort_values(by=['age', 'sex'], ascending=False)

# 對某一列進行繪圖
# 具體api參考此處
# http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.plot.html#pandas.Series.plot
df['height'].plot(kind='bar')

# 設置字體,防止中文被顯示成方框
plt.rcParams['font.sans-serif'] = ['KaiTi']
plt.rcParams['font.serif'] = ['KaiTi']

# 顯示窗體
plt.show()

運行即可。

以下柱狀圖爲測試數據:



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章