在處理python字符串尤其是漢語時會遇到各種編碼錯誤。
我們可以用一個叫chardet的庫中的detect檢查字符串的編碼方式。然後進行轉換。
我通過下面的函數解決漢語編碼問題。
import chardet
def codingurf8(str):
if chardet.detect(str)['encoding'] != 'utf-8':
str = str.decode(chardet.detect(str)['encoding']).encode('utf-8')
return str