解決python中文編碼混亂的問題

在處理python字符串尤其是漢語時會遇到各種編碼錯誤。

我們可以用一個叫chardet的庫中的detect檢查字符串的編碼方式。然後進行轉換。

我通過下面的函數解決漢語編碼問題。

import chardet
def codingurf8(str):
    if chardet.detect(str)['encoding'] != 'utf-8':
        str = str.decode(chardet.detect(str)['encoding']).encode('utf-8')
    return str


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章