實現html表格與excel表格的相互轉化。方法很簡單。
近期想把網頁上的表格下載保存成excel文件。網上的辦法要麼表述不清,要麼太過繁雜。始終沒有找到很好的解決辦法。
最後我通過學習pandas模塊簡單的實現了這一過程。
解決中文亂碼的文章:解決python中文編碼混亂的問題
實現的代碼如下:
import pandas
with open('C:\Users\zhaoyingh\Desktop\\a.txt','r') as f:
df = pandas.read_html(f.read().decode("gb2312").encode('utf-8'),encoding='utf-8')
print df[0]
bb = pandas.ExcelWriter('out.xlsx')
df[0].to_excel(bb)
bb.close()
同樣的pandas中含有read_excel和to_html函數實現excel與html之間的轉化。