pandas時間序列空值填充

原創

2020-05-17 20:33

1.讀入csv文件

novels_month = pd.read_csv(csv_path)

2.生成時間索引

#2004-12-1是時間序列開始的時間，並以月爲間隔
rng = pd.date_range('2004-12-1', periods = int((pd.Period(novels_month.iloc[-1,0],'M') - pd.Period('2004-12-1','M')).freqstr[0:-1]), freq = 'M') + pd.Timedelta('1 day')

s = pd.Series(rng)

3.生成一個空的DataFrame

empty = pd.DataFrame([],columns=["update_date","rating_total"])
empty["update_date"] = s
empty

4.填充DataFrame

#這裏是使用的臨近值進行填充
c_list = list(novels_month[0]["update_date"]);
counter = 2 #novels_month的第一個非空值的位置
for i in range(len(empty)):
    f_val = str(pd.Period(empty.iloc[i,0],'M'))
    if f_val in c_list:
        val = novels_month[0].iloc[c_list.index(f_val),1]
        empty.iloc[i,1] =  val
        counter = c_list.index(f_val)
    else:
        #將值填充爲最鄰近的一個值
        empty.iloc[i,1] =  novels_month[0].iloc[counter,1]

5.重新保存csv文件

empty.to_csv(os.path.join(NOVEL_PATH,"test.csv"), index_label="index_label")

6.補充

使用fillna進行值的填充

# 通過fillna填充缺失值 
# https://www.jianshu.com/p/79086fa52803

median = housing["total_bedrooms"].median() sample_incomplete_rows["total_bedrooms"].fillna(median, inplace=True) # option 3 sample_incomplete_rows

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

pandas時間序列空值填充

1.讀入csv文件

2.生成時間索引

3.生成一個空的DataFrame

4.填充DataFrame

5.重新保存csv文件

6.補充

[軟件工具百科] 互聯網資源歷史快照歸檔站點與數字圖書館

網易面試：SpringBoot如何開啓虛擬線程？

杭州的 IT 崩盤了麼？

程序員常見的文本查看工具

VS2022 解決方案打不開 .NET Framework 4.0 、 4.5 等老項目

Vue3 運行可以，build 打包發佈報錯，app.config.globalProperties 用法坑

既然測試也要求寫代碼，那乾脆讓開發兼任測試不就好了嗎？

ITSM落地經驗之建設藍圖規劃

PDF 補丁丁 1.0.2 版更新

奇怪！應用的日誌呢？？

inline-block元素排列(筆記)

Mongoose populate 與多張表多級關聯查詢

安卓服務的啓動、停止、綁定與解綁的簡單使用

用sessionStorage編寫一個瀏覽器標籤頁管理器（sessionstorage存儲對象的應用）

sessionStorage與localStorage對象使用注意

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結