PHP封裝curl採集數據函數

原創

2020-02-21 21:05

採集數據，也就是爬蟲，對於PHP同樣能夠做到，通過封裝curl採集數據函數，從而實現對數據的採集利用

<?php

public function g_url_contents($url, $reurl = '', $ip = '')
{
      $ch         = curl_init();
      $timeout    = 30;
      //設置你需要抓取的URL
      curl_setopt($ch, CURLOPT_URL, $url);
      //僞造來源ip
      if ($ip) {
          $header = array(
                'CLIENT-IP:' . $ip,
                'X-FORWARDED-FOR:' . $ip,
          );
          curl_setopt($ch, CURLOPT_HTTPHEADER, $header);
     }
     //隨機生成一個user_agent 
     $binfo = array('Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; 
     Trident/4.0; .NET CLR 2.0.50727; InfoPath.2; AskTbPTV/5.17.0.25589; 
     Alexa Toolbar)','Mozilla/5.0 (Windows NT 5.1; rv:22.0) Gecko/20100101 
     Firefox/22.0','Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; 
     Trident/4.0; .NET4.0C; Alexa Toolbar)','Mozilla/4.0(compatible; 
     MSIE 6.0; Windows NT 5.1; SV1)',$_SERVER['HTTP_USER_AGENT']);
     $user_agent = $binfo[mt_rand(0,3)];
     
     //下面這個是單個的，有可能被監測到
     //$user_agent = $_SERVER['HTTP_USER_AGENT']
        
     //執行curl_exec是把輸出做爲返回值,不會輸出到瀏覽器
     curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
     //在發起連接前等待的時間，如果設置爲0，則不等待
     curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
     //在HTTP請求中包含一個”user-agent”頭的字符串
     curl_setopt($ch, CURLOPT_USERAGENT, $user_agent);
     //設置這個選項爲一個非零值(像 “Location: “)的頭，服務器會把它當做
     //HTTP頭的一部分發送(注意這是遞歸的，PHP將發送形如 “Location: “的頭)
     curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
     
     //僞造來源referer
     if ($reurl) {
         curl_setopt($ch, CURLOPT_REFERER, $reurl);
     }
     @$c = curl_exec($ch);//執行請求
     curl_close($ch);//關閉url請求
     return $c;
}

以上完成的操作如有不正確的地方還望諸位多多指教

Pluto_Hjg

發佈了32 篇原創文章 · 獲贊 27 · 訪問量 4萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

PHP封裝curl採集數據函數

以上完成的操作如有不正確的地方還望諸位多多指教

vue項目獲取富文本編輯器wangEditor內容導出爲word（html轉word格式並下載）

dotnet C# 創建 X11 應用時設置窗口背景顏色

TDengine docker安裝方法

vue3組件通信與props

sapui5

Alpine Linux apk add DNS lookup error

部分JDK版本的發佈時間

工作中用到的腳本合集

合併代碼時Beyond Compare設置

go語言 defer延遲機制

Linux中的htop命令

PHP使用PHPMailer發送郵件

淺談 .gitignore 設置忽略上傳的文件

淺談安裝虛擬機並在其基礎安裝CentOs

淺談學習redis遇到的坑

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結