本文開始記錄python相關得小tips,然後持續更新。
一般都是學習開發中遇到得一些小bug,需要百度一會才能找到合適得答案,所以這裏記錄,後續查找或者作爲新人學習時解決問題,都是很好的資料。
一、爬蟲篇:
1.寫爬蟲得時候,一般會往文件寫入東西,而這時會發生exception:
UnicodeEncodeError: 'gbk' codec can't encode character ... ... bla bla bla
解決答案是:加上encoding utf-8
csv_file = open("neteasy.csv", "w", newline="", encoding='utf-8')
原理是:https://www.cnblogs.com/themost/p/6603409.html
2.當文件保存成csv時,如何打開?保證不亂碼?
打開最好還是用excel而不是記事本或者notepad;不過,需要先用notepad或者記事本轉碼。
1中看到,我們是utf-8編碼打開文件得,所以文件格式是utf-8,而excel默認事gbk編碼去解析得,所以會出現亂碼。
用notepad或者記事本進行轉碼並保存即可,然後用excel打開就是正常顯示的了。
然後點擊保存,再用excel打開: