PHP去除BOM頭

BOM: Byte Order Mark
UTF-8 BOM又叫UTF-8 簽名,其實UTF-8 的BOM對UFT-8沒有作用,是爲了支援UTF-16,UTF-32才加上的BOM,BOM簽名的意思就是告訴編輯器當前文件採用何種編碼,方便編輯器識別,但是BOM雖然在編輯器中不顯示,但是會產生輸出,就像多了一個空行,


如果您在修改任何PHP文件後發生:

* 不能登入或者不能登出; * 頁頂出現一條空白; * 頁頂出現錯誤警告; * 其它不正常的情況。

則多半是編輯器的問題。

本程序採用UTF-8編碼。現在幾乎所有的文本編輯軟件都可以顯示並編輯UTF-8編碼的文件。但是很遺憾,其中很多軟件的表現並不理想。

類似WINDOWS自帶的記事本等軟件,在保存一個以UTF-8編碼的文件時,會在文件開始的地方插入三個不可見的字符(0xEF 0xBB 0xBF,即BOM)。它是一串隱藏的字符,用於讓記事本等編輯器識別這個文件是否以UTF-8編碼。對於一般的文件,這樣並不會產生什麼麻煩。但對於 PHP來說,BOM是個大麻煩。

PHP並不會忽略BOM,所以在讀取、包含或者引用這些文件時,會把BOM作爲該文件開頭正文的一部分。根據嵌入式語言的特點,這串字符將被直接執行(顯示)出來。由此造成即使頁面的 top padding 設置爲0,也無法讓整個網頁緊貼瀏覽器頂部,因爲在html一開頭有這3個字符呢!

最大的麻煩還不是這個。受COOKIE送出機制的限制,在這些文件開頭已經有BOM的文件中,COOKIE無法送出(因爲在COOKIE送出前PHP已經送出了文件頭),所以登入和登出功能失效。一切依賴COOKIE、SESSION實現的功能全部無效。

因此,在編輯、更改任何文本文件時,請務必使用不會亂加BOM的編輯器。Linux下的編輯器應該都沒有這個問題。WINDOWS下,請勿使用記事本等編輯器。推薦的編輯器是: Editplus 2.12版本以上; EmEditor; UltraEdit(需要取消‘添加BOM’的相關選項); Dreamweaver(需要取消‘添加BOM’的相關選項) 等。

對於已經添加了BOM的文件,要取消的話,可以用以上編輯器另存一次。(Editplus需要先另存爲gb,再另存爲UTF-8。) ,以下是程序解決方案:


<?php

header('content-Type: text/html; charset=utf-8');

if(isset($_GET['dir'])){ //設置文件目錄,如果沒有設置,則自動設置爲當前文件所在目錄

   $basedir=$_GET['dir'];

}else{

   $basedir='.';

}

$auto=1;/*設置爲1標示檢測BOM並去除,設置爲0標示只進行BOM檢測,不去除*/


echo '當前查找的目錄爲:'.$basedir.'當前的設置是:';

echo $auto?'檢測文件BOM同時去除檢測到BOM文件的BOM<br />':'只檢測文件BOM不執行去除BOM操作<br />';


checkdir($basedir);

function checkdir($basedir){

   if($dh=opendir($basedir)){

       while (($file=readdir($dh)) !== false){

           if($file != '.' && $file != '..'){

               if(!is_dir($basedir.'/'.$file)){

                   echo '文件: '.$basedir.'/'.$file .checkBOM($basedir.'/'.$file).' <br>';

               }else{

                   $dirname=$basedir.'/'.$file;

                   checkdir($dirname);

               }

           }

       }

       closedir($dh);

   }

}

function checkBOM($filename){

   global $auto;

   $contents=file_get_contents($filename);

   $charset[1]=substr($contents,0,1);

   $charset[2]=substr($contents,1,1);

   $charset[3]=substr($contents,2,1);

   if(ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191){

       if($auto==1){

           $rest=substr($contents,3);

           rewrite($filename,$rest);

           return (' <font color=red>找到BOM並已自動去除</font>');

       }else{

           return (' <font color=red>找到BOM</font>');

       }

   }else{

       return (' 沒有找到BOM');

   }

}

function rewrite($filename,$data){

   $filenum=fopen($filename,'w');

   flock($filenum,LOCK_EX);

   fwrite($filenum,$data);

   fclose($filenum);

}/*將以上代碼保存爲後綴爲php的文件放到需要去除bom的文件目錄裏面,然後運行該php文件,將會對該目錄以及該目錄所有的子目錄下的文件進行bom檢查並去除bom,運行結果頁面如下:

本文轉載自: PHP程序員筆記(http://www.phpernote.com/)

詳細出處參考:http://www.phpernote.com/php-string/133.html -->*/

?>


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章