恩格爾係數計算
恩格爾係數,它表示食品支出佔一個人總支出的比重。那麼下面文文將根據官方給出的數據,帶你一步步分析計算每個人的恩格爾係數。
1)讀取數據
我們利用pandas的read_csv方法將數據讀入到DataFrame中:
#沒有columns數據,header屬性設置爲None
card_df=pd.read_csv('card_train.txt',header=None)
由於官方沒有給定colunms,我們對columns屬性進行賦值:
card_df.columns = ['id','consume','where','how','time','amount','remainder']
我們可以先來看一下前10行的數據,使用head()方法
print (card_df.head(10))
輸出結果如下:
id consume where how time amount remainder1006 POS消費 地點551 淋浴 2013/09/01 0.50 124.901006 POS消費 地點551 淋浴 2013/09/01 0.50 124.901968 POS消費 地點159 淋浴 2013/09/01 0.10 200.141968 POS消費 地點159 淋浴 2013/09/01 0.10 200.141406 POS消費 地點660 開水 2013/09/01 0.01 374.421406 POS消費 地點660 開水 2013/09/01 0.01 374.421406 POS消費 地點78 其他 2013/09/01 0.60 373.821406 POS消費 地點78 其他 2013/09/01 0.60 373.8213554 POS消費 地點6 淋浴 2013/09/01 0.50 522.3713554 POS消費 地點6 淋浴 2013/09/01 0.50 522.37