在svn上提交了一個文件trac進行codereview 的時候,發現其中的中文是亂碼,猜測是文件編碼的問題,用emedit查看之後,發現這個文件的編碼時utf-8 (無bom)格式,然後對比了一下其它顯示正確的文件格式:utf-8(含bom),問題就是bom有無的問題,使用emedit保存完後,調查了一下這個bom是什麼.
"UTF- 8編碼的文件中,BOM佔三個字節。如果用記事本把一個文本文件另存爲UTF-8編碼方式的話,用UE打開這個文件,切換到十六進制編輯狀態就可以看到開 頭的FFFE了。這是個標識UTF-8編碼文件的好辦法,軟件通過BOM來識別這個文件是否是UTF-8編碼,很多軟件還要求讀入的文件必須帶BOM。可 是,還是有很多軟件不能識別BOM。"
"UTF-8 BOM又叫UTF-8 簽名,其實UTF-8的BOM對UFT-8沒有作用,是爲了支援UTF-16,UTF-32才加上"
才發現這個bom在utf-8格式的文件中代表了頭三個字節“EF BB BF”,很多文件就沒有這個概念,經常會被當做數據進行處理。php好像暫時不支持,不能處理帶bom的utf-8文件。
所以說,數據文件最好不要帶bom,當然你如果知道bom,處理程序中做了處理那就是另一說了。,
關於文件的UTF-8的BOM標記問題記錄
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
PHP去除BOM頭
brokenjoin
2019-02-22 18:04:44
python 編碼問題
ywdcj930102
2019-02-22 23:34:32
析Unicode和UTF-8
key001
2019-02-22 16:55:12
利用Notepad將Base64+GBK 轉爲明碼UTF-
小慢哥
2019-02-22 13:56:25
純C實現unicode-utf8互轉
狼性執行
2019-02-22 13:52:28
utf8字符串截取
zhongyi_hlju
2019-02-22 13:22:00
十分鐘搞清字符集和字符編碼 頂 原 薦
失敗人士
2018-12-02 21:31:20
UTF8轉成GB2312亂碼問題解決方案
神馬文庫
2018-10-25 22:03:55
批量編碼轉換腳本cp936轉utf8
ritto
2018-09-13 02:34:11
HEX文件格式分析 - 適用MPLAB
ypixunil
2019-02-22 15:34:21
怎麼把PPT文件轉成PDF文件格式
轉換達人
2019-02-16 12:51:59
手機中如何處理Excel格式轉換PDF格式
辦公家
2018-09-16 02:43:25
各種文件後綴名與打開方式
badboycx
2018-09-13 02:30:00