python讀取文件 \ufeff 問題

    df_ID= pd.read_csv(IDfile_path,encoding= 'utf-8',sep = ',',header=None)
    ID_list= list(df_ID.ix[:,0])
    print(ID_list)

我的原始輸出:

['\ufeffee170175-35de-43b8-ad92-a70600b6da3a', '266d79c7-4ca9-483e-926a-a714013eb22b',。。。

在已經設置好讀取文件編碼方式的情況下,輸出的首行有編碼問題,出現“'\ufeff”。

解決方案:

方案一:檢查原文件,Notepad++是一個很好的代碼查看器,“編碼”選項可以查看或重設編碼方式,我發現我文件的編碼是“ UTF-8 BOM”,將其改爲:‘ UTF-8’

再次輸出,恢復原樣:

['ee170175-35de-43b8-ad92-a70600b6da3a', '266d79c7-4ca9-483e-926a-a714013eb22b'

 

方案二:查詢網上的另一種方案:

item.encode('utf-8').decode('utf-8-sig').strip()

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章