類似於這樣的效果:
首先我們下載Snoopy這個類。
然後我們新建一個php文件(collection.php)寫如下代碼:
通過開發者工具我們可以看到文章主要內容在rich_media_content這個類裏面,並且此類在頁面中是唯一的元素。
<?
header("Content-type: text/html; charset=utf-8");
include("Snoopy.class.php");
$sn =$_GET['sn'];
$url = $sn;
$pos = strpos($url,'mp.weixin.qq.com');//指定url規則,只抓取微信文章
if ($pos == false) {
echo '1';
exit();//判斷url路徑是否正確,不正確返回一個數字1表示。
} else {
$snoopy = new Snoopy; //實例化Snoopy這個類
$snoopy->fetch($url); //獲取所有內容
$contents=$snoopy->results;
preg_match('|<div class="rich_media_content " id="js_content">(.*?)<\/div>|si',$contents,$m);//設置需要抓取頁面中那塊內容
$m[1] = str_replace("data-src", "src",$m[1]);
echo $m[1];
}
?>
具體效果請看:微信圖文抓取