使用Snoopy類實現微信圖文抓取功能

類似於這樣的效果:
這裏寫圖片描述
首先我們下載Snoopy這個類。
然後我們新建一個php文件(collection.php)寫如下代碼:
通過開發者工具我們可以看到文章主要內容在rich_media_content這個類裏面,並且此類在頁面中是唯一的元素。
這裏寫圖片描述

<? 
header("Content-type: text/html; charset=utf-8");
include("Snoopy.class.php"); 
$sn =$_GET['sn'];
$url = $sn; 
$pos = strpos($url,'mp.weixin.qq.com');//指定url規則,只抓取微信文章
if ($pos == false) {
    echo '1'; 
    exit();//判斷url路徑是否正確,不正確返回一個數字1表示。
} else {
 $snoopy = new Snoopy; //實例化Snoopy這個類
$snoopy->fetch($url); //獲取所有內容 
$contents=$snoopy->results;
preg_match('|<div class="rich_media_content " id="js_content">(.*?)<\/div>|si',$contents,$m);//設置需要抓取頁面中那塊內容
$m[1] = str_replace("data-src", "src",$m[1]);
echo $m[1];  
}
?> 

具體效果請看:微信圖文抓取

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章