數據記錄1948年~2016年每個月份的美國失業率情況
顯示中文
在代碼中加入
from pylab import * mpl.rcParams['font.sans-serif']=['SimHei']
報錯:TypeError: only size-1 arrays can be converted to Python scalars
給plt.bar函數傳的參數y列表裏面不是純數字
載入數據
import pandas as pd
data=pd.read_csv('UNRATE.csv')
# 求每一年的平均值
year=[]
for i in range(1948,2017):
year.append(i)
year_mean=[]
for i in range(len(year)):
year_mean.append(float(data[i*12:12+12*i].mean()))
折線圖
# 折線圖
from pylab import *
mpl.rcParams['font.sans-serif']=['SimHei']
import matplotlib.pyplot as plt
fig=plt.figure(figsize=(15,4))
plt.plot(year,year_mean,'o-')
plt.xticks(year,rotation=90)
plt.title('1948~2016平均失業率')
plt.show
失業率是否與經紀危機有關?
美國自1783年取得了對英國殖民者的獨立戰爭勝利後,先後分別於1825年、1837年、1847年、1857年、1866年、1873年、1882年、1890年、1900年、1907年、1920-21年、1929-33年、1937-38年、1948-49年、1957-58年、1969-70年、1974-75年、1980-82年、1990-91年、2007-12年多次發生過經濟危機。
可以看到失業率與經濟危機有一定關係
條形對比圖
我不知道要畫哪種圖,有什麼想要從數據中知道的信息
失業率和很多因素有關,這裏我只有年份和失業率,所以只能夠畫出折線圖來看失業率在哪些年份增長快,可能是因爲當年的一些因素。整體的趨勢就是上升下降
失業率會不會和月份有關?
每三年放在一起看了一下,除了那一年失業率平均值上升的年份,每月的失業率有浮動外,其他基本不變,所以說失業和月份沒關係。
還有啥?
ARIMA時間序列預測趨勢
幾個關鍵性的圖
1.原始數據的趨勢圖
2.一階差分圖
3.ACF&PACF
4.AIC:(4,2);BIC(3,2)
5.預測趨勢圖
這預測的我也是醉了。預測趨勢上升,實際下降。。。