現象:最近需要抓取一些網頁的信息,但發現Python的亂碼問題相對Java來說,不太一樣。按照以往Java解決中文亂碼問題的思路去解決Python亂碼,貌似行不通,報錯信息:
SyntaxError: Non-ASCII character '\xe5' in file
原因:Python默認是以ASCII作爲編碼方式的,如果在自己的Python源碼中包含了中文(或者其他的語言,比如小日本的日語……),此時即使你把自己編寫的Python源文件以UTF-8格式保存了;但實際上,這依然是不行的。
解決方法:在源碼的第一行添加以下語句:
# -*- coding: UTF-8 -*-
或者
#coding=utf-8
(注:此語句一定要添加在源代碼的第一行)
我們可以將其添加到python模板裏,就不必每次都手動寫了
第一步,找到設置
第二步設置模板
第一行就是設置python使用的編碼格式
第二行是創建py文件時自動生成時間
第三行是py文件名字
第四行是使用的IDE的名字
點擊應用後確定
新建一個py文件,我們可以發現,自動生成了下列內容