curl 選項屬性配置說明

這幾天工作有大量用curl,curl就是模擬瀏覽器來傳輸數據,他支持很多的協議HTPP,HTTPS,FTP….等等很多協議,在做採集和模擬用戶來執行一些操作的時候非常有用的。
使用CURL主要是四個步驟:
1、初始化URL
2、設置請求的一些參數(COOKIE,HEAD…)
3、執行請求
4、關閉資源
先說一個簡單的採集,一般在獲取一個網頁的內容的時候我們最方便就是使用file_get_contents()函數來獲取,現在我們通過CURL來抓取一個網頁的內容

 代碼如下 複製代碼

$ch = curl_init();//初始化一個資源
       curl_setopt($ch,CURLOPT_URL,”http://www.mapenggang.com”);//設置我們要獲取的網頁
       curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);//關閉直接輸出
       $string= curl_exec($ch);
       curl_close($ch);


注:重點在於curl_setopt()這個函數的第二個參數(下面會有一些常用的資料)
這樣我們就可以得到這個網頁的內容,如果只有CURL來做些這就大材小用了,CURL其實可以用來做更加神奇的東西。
最近剛到一家創業型的新公司(尼瑪,選擇這個公司真的是比較糾結,因爲手裏有好幾個offer,但是這邊給的工資待遇很低,因爲創業型公司嗎。我也不知道爲什麼會選擇這家公司,反正是爲了選擇這家公司,朋友都很不解,其實我也不知道爲什麼會選擇這家,其他公司的工資大概是這家公司的兩倍,希望這次沒有選錯,不然.想死的心都會有,說了這麼多廢話),做的是現在比較火的微信公衆平臺的開發,因爲微信現在開放的接口特別的少,所以通過接口得到的東西特別的少(尼瑪,小馬哥你什麼時候多放的藉口啊!),但是官方提供的操作平臺有很多接口中沒有數據所以,我們需要去自己去找一些數據了,好吧,主角上場CURL。

首先公衆平臺是要登錄才能訪問,那我就先登錄吧(廢話),首先需要抓包分析一下正常提交數據,這裏我就不截圖了(博客在bae平臺上,編輯器還沒有時間去理他,不太好使),通過抓包分析得出,微信的公衆平臺使用的是ajax登錄,且密碼在提交之前已經進行了md5加密(好像正規應該叫md5散列把,而且標準的MD5散列應該是128位的,不過爲了方便存儲和傳輸就現在最多的就是32和16位了,剛瞭解,慚愧),還有很重要一點就是,微信公衆平臺採用的是https協議進行登錄的。最爽的一點就是不用驗證碼,sogay。不然老費勁了,分析到這就可以了。Come on !!!!

 代碼如下 複製代碼


$password = md5($password);//因爲剛纔抓包發現是md5加密過的,所以這裏我們提前把密碼加密號


$post = "username={$username}&pwd={$password}&f=json&imgcode=";
$loginUrl = "https://mp.weixin.qq.com/cgi-bin/login?";//微信登錄的地址

//這裏的頭信息都是必須要設置的,這些你都可以在剛纔抓包的時候獲取到


$headerArray = array(
'Accept:application/json, text/javascript, */*',
'Content-Type:application/x-www-form-urlencoded',
'Referer:https://mp.weixin.qq.com/'
);

$ch = curl_init();
curl_setopt($ch,CURLOPT_URL,$loginUrl);
// 對認證證書來源的檢查,0表示阻止對證書的合法性的檢查。
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
// 從證書中檢查SSL加密算法是否存在
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);//關閉直接輸出
curl_setopt($ch,CURLOPT_POST,1);//使用post提交數據
curl_setopt($ch,CURLOPT_POSTFIELDS,$post);//設置 post提交的數據
curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/30.0.1599.69 Safari/537.36');//設置用戶代理
curl_setopt($ch,CURLOPT_HTTPHEADER,$headerArray);//設置頭信息

curl_setopt($ch,CURLOPT_COOKIEJAR,$cookie_file);//設置cookie的保存目錄,這裏很重要,你懂的(cookie你都不存,你以爲你是麻花騰啊!)
$loginData = curl_exec($ch);//這裏會返回token,需要處理一下。

//獲取到token的值

$loginData = json_decode($loginData,true);

$token = explode("=",$loginData['ErrMsg']);

$token = array_pop($token);

echo "登錄微信系統成功<br />";


curl_close($ch);


 

上邊就是登錄微信公衆平臺的代碼了,經測試十分好用+_+。
這幾天微信公衆平臺接觸的比較多,這個只是萬里長征的第一步,後邊我會分享一下如何將微信的fakeid 和 openid對應起來,實現自己可以自己的平臺上顯示用戶的完整信息(據我瞭解,網上現在對於如何fakeid 和 openid對應來沒有很好的解決方案,通過好幾天的奮鬥現在已經可以對應起來的,比較麻煩,且已有的用戶是無法對起來的(其實這個理論上是可以的,但是沒有做出來不亂說,其實是沒有時間去做這個,有機會可以嘗試,不過實現需要已有系統的支持,也就是你現在的系統必須記錄了和用回的聊天記錄(我說什麼了?我什麼都沒有說!)))。
體育老師啊,你說你不好好帶你的體育課,沒有跑來教我們語文,這幾天接觸不少能寫的東西太多了,所以想到那就寫到那了,有點亂,幾天主要用的是CURL,所以今天說點CURL的實例,正好就把手頭的登錄微信公衆平臺的東西寫上來了,CURL到此結束,後邊我可能會寫更多關於微信公衆平臺的東西。
附:

選項

可選value

備註

CURLOPT_AUTOREFERER

當根據Location:重定向時,自動設置header中的Referer:信息。

 

CURLOPT_BINARYTRANSFER

在啓用CURLOPT_RETURNTRANSFER的時候,返回原生的(Raw)輸出。

 

CURLOPT_COOKIESESSION

啓用時curl會僅僅傳遞一個session cookie,忽略其他的cookie,默認狀況下cURL會將所有的cookie返回給服務端。session cookie是指那些用來判斷服務器端的session是否有效而存在的cookie

 

CURLOPT_CRLF

啓用時將Unix的換行符轉換成回車換行符。

 

CURLOPT_DNS_USE_GLOBAL_CACHE

啓用時會啓用一個全局的DNS緩存,此項爲線程安全的,並且默認啓用。

 

CURLOPT_FAILONERROR

顯示HTTP狀態碼,默認行爲是忽略編號小於等於400HTTP信息。

 

CURLOPT_FILETIME

啓用時會嘗試修改遠程文檔中的信息。結果信息會通過curl_getinfo()函數的CURLINFO_FILETIME選項返回。 curl_getinfo().

 

CURLOPT_FOLLOWLOCATION

啓用時會將服務器服務器返回的"Location: "放在header中遞歸的返回給服務器,使用CURLOPT_MAXREDIRS可以限定遞歸返回的數量。

 

CURLOPT_FORBID_REUSE

在完成交互以後強迫斷開連接,不能重用。

 

CURLOPT_FRESH_CONNECT

強制獲取一個新的連接,替代緩存中的連接。

 

CURLOPT_FTP_USE_EPRT

啓用時當FTP下載時,使用EPRT (LPRT)命令。設置爲FALSE時禁用EPRTLPRT,使用PORT命令 only.

 

CURLOPT_FTP_USE_EPSV

啓用時,在FTP傳輸過程中回覆到PASV模式前首先嚐試EPSV命令。設置爲FALSE時禁用EPSV命令。

 

CURLOPT_FTPAPPEND

啓用時追加寫入文件而不是覆蓋它。

 

CURLOPT_FTPASCII

CURLOPT_TRANSFERTEXT的別名。

 

CURLOPT_FTPLISTONLY

啓用時只列出FTP目錄的名字。

 

CURLOPT_HEADER

啓用時會將頭文件的信息作爲數據流輸出。

 

CURLINFO_HEADER_OUT

啓用時追蹤句柄的請求字符串。

PHP 5.1.3 開始可用。CURLINFO_前綴是故意的(intentional)

CURLOPT_HTTPGET

啓用時會設置HTTPmethodGET,因爲GET是默認是,所以只在被修改的情況下使用。

 

CURLOPT_HTTPPROXYTUNNEL

啓用時會通過HTTP代理來傳輸。

 

CURLOPT_MUTE

啓用時將cURL函數中所有修改過的參數恢復默認值。

 

CURLOPT_NETRC

在連接建立以後,訪問~/.netrc文件獲取用戶名和密碼信息連接遠程站點。

 

CURLOPT_NOBODY

啓用時將不對HTML中的BODY部分進行輸出。

 

CURLOPT_NOPROGRESS

啓用時關閉curl傳輸的進度條,此項的默認設置爲啓用。

Note:PHP自動地設置這個選項爲TRUE,這個選項僅僅應當在以調試爲目的時被改變。

 

 

CURLOPT_NOSIGNAL

啓用時忽略所有的curl傳遞給php進行的信號。在SAPI多線程傳輸時此項被默認啓用。

cURL 7.10時被加入。

CURLOPT_POST

啓用時會發送一個常規的POST請求,類型爲:application/x-www-form-urlencoded,就像表單提交的一樣。

 

CURLOPT_PUT

啓用時允許HTTP發送文件,必須同時設置CURLOPT_INFILECURLOPT_INFILESIZE

 

CURLOPT_RETURNTRANSFER

curl_exec()獲取的信息以文件流的形式返回,而不是直接輸出。

 

CURLOPT_SSL_VERIFYPEER

禁用後cURL將終止從服務端進行驗證。使用CURLOPT_CAINFO選項設置證書使用CURLOPT_CAPATH選項設置證書目錄 如果CURLOPT_SSL_VERIFYPEER(默認值爲2)被啓用,CURLOPT_SSL_VERIFYHOST需要被設置成TRUE否則設置爲FALSE

cURL 7.10開始默認爲TRUE。從cURL 7.10開始默認綁定安裝。

CURLOPT_TRANSFERTEXT

啓用後對FTP傳輸使用ASCII模式。對於LDAP,它檢索純文本信息而非HTML。在Windows系統上,系統不會把STDOUT設置成binary模式。

 

CURLOPT_UNRESTRICTED_AUTH

在使用CURLOPT_FOLLOWLOCATION產生的header中的多個locations中持續追加用戶名和密碼信息,即使域名已發生改變。

 

CURLOPT_UPLOAD

啓用後允許文件上傳

 

CURLOPT_VERBOSE

啓用時會彙報所有的信息,存放在STDERR或指定的CURLOPT_STDERR中。

 

對於下面的這些option的可選參數,value應該被設置一個integer類型的值:

 

選項

可選value

備註

CURLOPT_BUFFERSIZE

每次獲取的數據中讀入緩存的大小,但是不保證這個值每次都會被填滿。

cURL 7.10中被加入。

CURLOPT_CLOSEPOLICY

不是CURLCLOSEPOLICY_LEAST_RECENTLY_USED就是CURLCLOSEPOLICY_OLDEST,還存在另外三個CURLCLOSEPOLICY_,但是cURL暫時還不支持。

 

CURLOPT_CONNECTTIMEOUT

在發起連接前等待的時間,如果設置爲0,則無限等待。

 

CURLOPT_CONNECTTIMEOUT_MS

嘗試連接等待的時間,以毫秒爲單位。如果設置爲0,則無限等待。

cURL 7.16.2中被加入。從PHP 5.2.3開始可用。

CURLOPT_DNS_CACHE_TIMEOUT

設置在內存中保存DNS信息的時間,默認爲120秒。

 

CURLOPT_FTPSSLAUTH

FTP驗證方式:CURLFTPAUTH_SSL (首先嚐試SSL)CURLFTPAUTH_TLS (首先嚐試TLS)CURLFTPAUTH_DEFAULT (cURL自動決定)

cURL 7.12.2中被加入。

CURLOPT_HTTP_VERSION

CURL_HTTP_VERSION_NONE(默認值,讓cURL自己判斷使用哪個版本)CURL_HTTP_VERSION_1_0 (強制使用 HTTP/1.0)CURL_HTTP_VERSION_1_1 (強制使用 HTTP/1.1)

 

CURLOPT_HTTPAUTH

使用的HTTP驗證方法,可選的值有:CURLAUTH_BASICCURLAUTH_DIGESTCURLAUTH_GSSNEGOTIATECURLAUTH_NTLMCURLAUTH_ANYCURLAUTH_ANYSAFE。 可以使用|位域()操作符分隔多個值,cURL讓服務器選擇一個支持最好的值。CURLAUTH_ANY等價於CURLAUTH_BASIC | CURLAUTH_DIGEST | CURLAUTH_GSSNEGOTIATE | CURLAUTH_NTLM. CURLAUTH_ANYSAFE等價於CURLAUTH_DIGEST | CURLAUTH_GSSNEGOTIATE | CURLAUTH_NTLM.

 

CURLOPT_INFILESIZE

設定上傳文件的大小限制,字節(byte)爲單位。

 

CURLOPT_LOW_SPEED_LIMIT

當傳輸速度小於CURLOPT_LOW_SPEED_LIMIT(bytes/sec)PHP會根據CURLOPT_LOW_SPEED_TIME來判斷是否因太慢而取消傳輸。

 

CURLOPT_LOW_SPEED_TIME

當傳輸速度小於CURLOPT_LOW_SPEED_LIMIT(bytes/sec)PHP會根據CURLOPT_LOW_SPEED_TIME來判斷是否因太慢而取消傳輸。

 

CURLOPT_MAXCONNECTS

允許的最大連接數量,超過是會通過CURLOPT_CLOSEPOLICY決定應該停止哪些連接。

 

CURLOPT_MAXREDIRS

指定最多的HTTP重定向的數量,這個選項是和CURLOPT_FOLLOWLOCATION一起使用的。

 

CURLOPT_PORT

用來指定連接端口。(可選項)

 

CURLOPT_PROTOCOLS

CURLPROTO_*的位域指。如果被啓用,位域值會限定libcurl在傳輸過程中有哪些可使用的協議。這將允許你在編譯libcurl時支持衆多協議,但是限制只是用它們中被允許使用的一個子集。默認libcurl將會使用全部它支持的協議。參見CURLOPT_REDIR_PROTOCOLS. 可用的協議選項爲:CURLPROTO_HTTPCURLPROTO_HTTPSCURLPROTO_FTPCURLPROTO_FTPSCURLPROTO_SCPCURLPROTO_SFTPCURLPROTO_TELNETCURLPROTO_LDAPCURLPROTO_LDAPSCURLPROTO_DICTCURLPROTO_FILECURLPROTO_TFTPCURLPROTO_ALL

cURL 7.19.4中被加入。

CURLOPT_PROXYAUTH

HTTP代理連接的驗證方式。使用在CURLOPT_HTTPAUTH中的位域標誌來設置相應選項。對於代理驗證只有CURLAUTH_BASICCURLAUTH_NTLM當前被支持。

cURL 7.10.7中被加入。

CURLOPT_PROXYPORT

代理服務器的端口。端口也可以在CURLOPT_PROXY中進行設置。

 

CURLOPT_PROXYTYPE

不是CURLPROXY_HTTP (默認值) 就是CURLPROXY_SOCKS5

cURL 7.10中被加入。

CURLOPT_REDIR_PROTOCOLS

CURLPROTO_*中的位域值。如果被啓用,位域值將會限制傳輸線程在CURLOPT_FOLLOWLOCATION開啓時跟隨某個重定向時可使用的協議。這將使你對重定向時限制傳輸線程使用被允許的協議子集默認libcurl將會允許除FILESCP之外的全部協議。這個和7.19.4預發佈版本種無條件地跟隨所有支持的協議有一些不同。關於協議常量,請參照CURLOPT_PROTOCOLS

cURL 7.19.4中被加入。

CURLOPT_RESUME_FROM

在恢復傳輸時傳遞一個字節偏移量(用來斷點續傳)。

 

CURLOPT_SSL_VERIFYHOST

1 檢查服務器SSL證書中是否存在一個公用名(common name)。譯者注:公用名(Common Name)一般來講就是填寫你將要申請SSL證書的域名 (domain)或子域名(sub domain)2 檢查公用名是否存在,並且是否與提供的主機名匹配。

 

CURLOPT_SSLVERSION

使用的SSL版本(2 3)。默認情況下PHP會自己檢測這個值,儘管有些情況下需要手動地進行設置。

 

CURLOPT_TIMECONDITION

如果在CURLOPT_TIMEVALUE指定的某個時間以後被編輯過,則使用CURL_TIMECOND_IFMODSINCE返回頁面,如果沒有被修改過,並且CURLOPT_HEADERtrue,則返回一個"304 Not Modified"headerCURLOPT_HEADERfalse,則使用CURL_TIMECOND_IFUNMODSINCE,默認值爲CURL_TIMECOND_IFUNMODSINCE

 

CURLOPT_TIMEOUT

設置cURL允許執行的最長秒數。

 

CURLOPT_TIMEOUT_MS

設置cURL允許執行的最長毫秒數。

cURL 7.16.2中被加入。從PHP 5.2.3起可使用。

CURLOPT_TIMEVALUE

設置一個CURLOPT_TIMECONDITION使用的時間戳,在默認狀態下使用的是CURL_TIMECOND_IFMODSINCE

 

對於下面的這些option的可選參數,value應該被設置一個string類型的值:

 

選項

可選value

備註

CURLOPT_CAINFO

一個保存着1個或多個用來讓服務端驗證的證書的文件名。這個參數僅僅在和CURLOPT_SSL_VERIFYPEER一起使用時纔有意義。 .

 

CURLOPT_CAPATH

一個保存着多個CA證書的目錄。這個選項是和CURLOPT_SSL_VERIFYPEER一起使用的。

 

CURLOPT_COOKIE

設定HTTP請求中"Cookie: "部分的內容。多個cookie用分號分隔,分號後帶一個空格(例如, "fruit=apple; colour=red")

 

CURLOPT_COOKIEFILE

包含cookie數據的文件名,cookie文件的格式可以是Netscape格式,或者只是純HTTP頭部信息存入文件。

 

CURLOPT_COOKIEJAR

連接結束後保存cookie信息的文件。

 

CURLOPT_CUSTOMREQUEST

使用一個自定義的請求信息來代替"GET""HEAD"作爲HTTP請求。這對於執行"DELETE" 或者其他更隱蔽的HTTP請求。有效值如"GET""POST""CONNECT"等等。也就是說,不要在這裏輸入整個HTTP請求。例如輸入"GET /index.html HTTP/1.0rnrn"是不正確的。

Note: 在確定服務器支持這個自定義請求的方法前不要使用。

 

 

CURLOPT_EGDSOCKET

類似CURLOPT_RANDOM_FILE,除了一個Entropy Gathering Daemon套接字。

 

CURLOPT_ENCODING

HTTP請求頭中"Accept-Encoding: "的值。支持的編碼有"identity""deflate""gzip"。如果爲空字符串"",請求頭會發送所有支持的編碼類型。

cURL 7.10中被加入。

CURLOPT_FTPPORT

這個值將被用來獲取供FTP"POST"指令所需要的IP地址。"POST"指令告訴遠程服務器連接到我們指定的IP地址。這個字符串可以是純文本的IP地址、主機名、一個網絡接口名(UNIX下)或者只是一個'-'來使用默認的IP地址。

 

CURLOPT_INTERFACE

網絡發送接口名,可以是一個接口名、IP地址或者是一個主機名。

 

CURLOPT_KRB4LEVEL

KRB4 (Kerberos 4) 安全級別。下面的任何值都是有效的(從低到高的順序)"clear""safe""confidential""private".。如果字符串和這些都不匹配,將使用"private"。這個選項設置爲NULL時將禁用KRB4 安全認證。目前KRB4 安全認證只能用於FTP傳輸。

 

CURLOPT_POSTFIELDS

全部數據使用HTTP協議中的"POST"操作來發送。要發送文件,在文件名前面加上@前綴並使用完整路徑。這個參數可以通過urlencoded後的字符串類似'para1=val1¶2=val2&…'或使用一個以字段名爲鍵值,字段數據爲值的數組。如果value是一個數組,Content-Type頭將會被設置成multipart/form-data

 

CURLOPT_PROXY

HTTP代理通道。

 

CURLOPT_PROXYUSERPWD

一個用來連接到代理的"[username]:[password]"格式的字符串。

 

CURLOPT_RANDOM_FILE

一個被用來生成SSL隨機數種子的文件名。

 

CURLOPT_RANGE

"X-Y"的形式,其中XY都是可選項獲取數據的範圍,以字節計。HTTP傳輸線程也支持幾個這樣的重複項中間用逗號分隔如"X-Y,N-M"

 

CURLOPT_REFERER

HTTP請求頭中"Referer: "的內容。

 

CURLOPT_SSL_CIPHER_LIST

一個SSL的加密算法列表。例如RC4-SHATLSv1都是可用的加密列表。

 

CURLOPT_SSLCERT

一個包含PEM格式證書的文件名。

 

CURLOPT_SSLCERTPASSWD

使用CURLOPT_SSLCERT證書需要的密碼。

 

CURLOPT_SSLCERTTYPE

證書的類型。支持的格式有"PEM" (默認值), "DER""ENG"

cURL 7.9.3中被加入。

CURLOPT_SSLENGINE

用來在CURLOPT_SSLKEY中指定的SSL私鑰的加密引擎變量。

 

CURLOPT_SSLENGINE_DEFAULT

用來做非對稱加密操作的變量。

 

CURLOPT_SSLKEY

包含SSL私鑰的文件名。

 

CURLOPT_SSLKEYPASSWD

CURLOPT_SSLKEY中指定了的SSL私鑰的密碼。

Note: 由於這個選項包含了敏感的密碼信息,記得保證這個PHP腳本的安全。

 

 

CURLOPT_SSLKEYTYPE

CURLOPT_SSLKEY中規定的私鑰的加密類型,支持的密鑰類型爲"PEM"(默認值)"DER""ENG"

 

CURLOPT_URL

需要獲取的URL地址,也可以在curl_init()函數中設置。

 

CURLOPT_USERAGENT

HTTP請求中包含一個"User-Agent: "頭的字符串。

 

CURLOPT_USERPWD

傳遞一個連接中需要的用戶名和密碼,格式爲:"[username]:[password]"


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章