實訓小結(1)

今日數據清洗流程
(一)使用Python爬取安居客網站的歷史房價信息
通過分析網站結構,用crawlcityhouse.py爬取生成結果文件anjuke.csv
(二)然後將anjuke.csv文件內容複製到txt文件中,形成txt文件
(三)對txt文件進行數據清洗,通過cleandata.py,提取時間信息,生成anjuke_demo.txt
(四)最後通過txt_transform_csv.py轉爲history.csv
(五)手動,通過Excel,用選中區域,按f5去掉空白行,形成最終文件

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章