今天分享一下,簡單的數據採集。數據採集就是把某個網站上的程序收錄到自己的數據庫或者網站上。
1、直接使用file_get_contents ps:開啓 php.ini 配置 中 allow_url_fopen =On;
file_get_contents 中的一些參數:
$data=file_get_contents("http://www.youku.com");
var_dump($data);
使用這種方式,是最簡單的,最容易理解的。直接對youku這個網站的數據扒取。但是對於類似於搜狐這種網站來說,這些網站在上線的時候是經過壓縮的,如果想解壓縮,使用"compress.zlib://"。
$data=file_get_contents("compress.zlib://".$url);
2、當然還有隻是想摘取其中幾部分內容,那麼可以用到正則來拼出摘取規則:
$url="https://blog.csdn.net/zph1234/rss/list";
$data=file_get_contents($url);
$preg='#<item>(.*)</item>#isU';
preg_match_all($preg,$data,$result);
其中的$result中的內容就是頁面中所有<item>標籤的內容。