對於未知編碼的bytes,要把它轉換成str,需要先“猜測”編碼。猜測的方式是先收集各種編碼的特徵字符,根據特徵字符判斷,就能有很大概率“猜對”。
當然,我們肯定不能從頭自己寫這個檢測編碼的功能,這樣做費時費力。chardet這個第三方庫正好就派上了用場。用它來檢測編碼,簡單易用。
在Anaconda下面安裝chardet非常簡單,只要進入Anaconda的目錄,使用如下命令:
conda install chardet
到這裏,chardet模塊就安裝成功了。
當然,我們肯定不能從頭自己寫這個檢測編碼的功能,這樣做費時費力。chardet這個第三方庫正好就派上了用場。用它來檢測編碼,簡單易用。
在Anaconda下面安裝chardet非常簡單,只要進入Anaconda的目錄,使用如下命令:
conda install chardet
到這裏,chardet模塊就安裝成功了。