df_ID= pd.read_csv(IDfile_path,encoding= 'utf-8',sep = ',',header=None)
ID_list= list(df_ID.ix[:,0])
print(ID_list)
我的原始輸出:
['\ufeffee170175-35de-43b8-ad92-a70600b6da3a', '266d79c7-4ca9-483e-926a-a714013eb22b',。。。
在已經設置好讀取文件編碼方式的情況下,輸出的首行有編碼問題,出現“'\ufeff”。
解決方案:
方案一:檢查原文件,Notepad++是一個很好的代碼查看器,“編碼”選項可以查看或重設編碼方式,我發現我文件的編碼是“ UTF-8 BOM”,將其改爲:‘ UTF-8’
再次輸出,恢復原樣:
['ee170175-35de-43b8-ad92-a70600b6da3a', '266d79c7-4ca9-483e-926a-a714013eb22b'
方案二:查詢網上的另一種方案:
item.encode('utf-8').decode('utf-8-sig').strip()