PHP抓取网页内容

其实就是利用curl把资源来过来以后筛出你想要的东西,本文只适合简单的页面抓取:直接上代码(注释都在代码)


    /**
     * 抓取APP查看版本网页
     */
    public function version(){
        @header('Content-type: text/html;charset=UTF-8');
        $url = "https://sj.qq.com/myapp/detail.htm?apkName=com.tencent.jgm";

        $ch = curl_init();
        curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 5000);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt($ch, CURLOPT_HTTPHEADER, array('User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 8_0 like Mac OS X) AppleWebKit/600.1.3 (KHTML, like Gecko) Version/8.0 Mobile/12A4345d Safari/600.1.4'));
        curl_setopt($ch, CURLOPT_URL, $url);
        curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
        curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
        $contents = curl_exec($ch);
        curl_close($ch);//关闭一打开的会话
        $str = strip_tags($contents);//先把html代码全部扒掉strip_tag函数处理

        preg_match_all('/\sV.*\s/',$str,$pat_array);//正则匹配你要想的东西,正则表达式根据自己的需求更改

        var_dump(trim($pat_array[0][0]));输出你获取的东西

    }

有疑问咨询WX:wqzbxh

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章