file_get_contents或者simplexml_load_file時亂碼

亂碼有幾種可能如下:

1.頁面能獲取過來,只是內容亂碼而已:可以採用iconv()和mb_convert_encoding()函數進行轉碼即可


2.當內容都無法正常獲取的時候,分兩種情況第一種是防盜鏈,第二種是頁面需要解壓

2.1防盜鏈情況下解決辦法比較簡單,模擬瀏覽器就可以了

    <?php  
        header('content-type:text/html;charset=utf-8');  
        $url="http://www.sohu.com/";  
        ini_set('user_agent','Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727;)');  
        $html=file_get_contents($url);  
        //echo $html;  
        echo mb_convert_encoding($html,'utf8','gbk');  

2.2需要解壓時,我們可以用以下方式

    <?php  
    header("content-type:text/html;charset=utf-8");  
    $url="http://wthrcdn.etouch.cn/WeatherApi?city=%E5%8C%97%E4%BA%AC";  
    $xml = simplexml_load_file("compress.zlib://".$url);  
    $json=json_encode($xml);  
    $arr=json_decode($json,true);  
    print_r($arr);  

curl添加參數方式模擬瀏覽器和解壓鏈接  http://blog.csdn.net/zph1234/article/details/50855740

發佈了27 篇原創文章 · 獲贊 1 · 訪問量 6萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章