bom頭怎麼去除

原文:http://my.oschina.net/xianggao/blog/79694



什麼是bom頭?


在utf-8編碼文件中BOM在文件頭部,佔用三個字節,用來標示該文件屬於utf-8編碼,現在已經有很多軟件識別bom頭,但是還有些不能識別bom頭,比如PHP就不能識別bom頭,這也是用記事本編輯utf-8編碼後執行就會出錯的原因了。其實UTF-8 的BOM對UFT-8沒有作用,是爲了支援UTF-16,UTF-32才加上的BOM,BOM簽名的意思就是告訴編輯器當前文件採用何種編碼,方便編輯器識別,但是BOM雖然在編輯器中不顯示,但是會產生輸出,就像多了一個空行。


類似WINDOWS自帶的記事本等軟件,在保存一個以UTF-8編碼的文件時,會在文件開始的地方插入三個不可見的字符(0xEF 0xBB 0xBF,即BOM)。它是一串隱藏的字符,用於讓記事本等編輯器識別這個文件是否以UTF-8編碼。對於一般的文件,這樣並不會產生什麼麻煩。但對於 PHP來說,BOM是個***煩。PHP並不會忽略BOM,所以在讀取、包含或者引用這些文件時,會把BOM作爲該文件開頭正文的一部分。根據嵌入式語言的特點,這串字符將被直接執行(顯示)出來。由此造成即使頁面的 top padding 設置爲0,也無法讓整個網頁緊貼瀏覽器頂部,因爲在html一開頭有這3個字符呢!最大的麻煩還不是這個。受COOKIE送出機制的限制,在這些文件開頭已經有BOM的文件中,COOKIE無法送出(因爲在COOKIE送出前PHP已經送出了文件頭),所以登入和登出功能失效。一切依賴COOKIE、SESSION實現的功能全部無效。因此,在編輯、更改任何文本文件時,請務必使用不會亂加BOM的編輯器。Linux下的編輯器應該都沒有這個問題。WINDOWS下,請勿使用記事本等編輯器。推薦的編輯器是: Editplus 2.12版本以上; EmEditor; UltraEdit(需要取消‘添加BOM’的相關選項); Dreamweaver(需要取消‘添加BOM’的相關選項) 等。對於已經添加了BOM的文件,要取消的話,可以用以上編輯器另存一次。(Editplus需要先另存爲gb,再另存爲UTF-8。)


去掉bom頭的辦法,簡單的是下面兩種:


1、editplus去BOM頭的方法


編輯器調整爲UTF8編碼格式後,保存的文件前面會多出一串隱藏的字符(也即是BOM),用於編輯器識別這個文件是否是以UTF8編碼。


運行Editplus,點擊工具,選擇首選項,選中文件,UTF-8標識選擇 總是刪除簽名,


然後對PHP文件編輯和保存後的PHP文件就是不帶BOM的了。


2、ultraedit去除bom頭辦法


打開文件後,另存爲選項的編碼格式裏選擇(utf-8 無bom頭),確定就ok了。


3、可以用vi 杜撰幾個,相關命令如下:

#設置UTF-8編碼
:set fileencoding=utf-8
#添加BOM
:set bomb
#刪除BOM
:set nobomb
#查詢BOM
:set bomb?

4、shell命令刪除

grep -r -I -l $'^\xEF\xBB\xBF' yaowan.properties.bak | xargs sed -i 's/^\xEF\xBB\xBF//g'


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章