linux curl是通過url語法在命令行下上傳或下載文件的工具軟件,它支持http,https,ftp,ftps,telnet等多種協議,常被用來抓取網頁和監控Web服務器狀態。
一、Linux curl用法舉例:
1. linux curl抓取網頁:
抓取百度:
1 | curl http://www.baidu.com |
如發現亂碼,可以使用iconv轉碼:
1
|
|
iconv的用法請參閱:在Linux/Unix系統下用iconv命令處理文本文件中文亂碼問題
2. Linux curl使用代理:
linux curl使用http代理抓取頁面:
1 2 | curl -x 111.95.243.36:80 http://iframe.ip138.com/ic.asp|iconv -fgb2312 curl -x 111.95.243.36:80 -U aiezu:password http://www.baidu.com |
使用socks代理抓取頁面:
1
2
|
curl
--socks4
202.113.65.229:443
http://iframe.ip138.com/ic.asp|iconv
-fgb2312
curl
--socks5
202.113.65.229:443
http://iframe.ip138.com/ic.asp|iconv
-fgb2312
|
代理服務器地址可以從爬蟲代理上獲取。
3. linux curl處理cookies
接收cookies:
1 | curl -c /tmp/cookies http://www.baidu.com #cookies保存到/tmp/cookies文件 |
發送cookies:
1
2
|
curl
-b
"key1=val1;key2=val2;"
http://www.baidu.com
#發送cookies文本
curl
-b
/tmp/cookies
http://www.baidu.com
#從文件中讀取cookies
|
4. linux curl發送數據:
linux curl get方式提交數據:
1 | curl -G -d "name=value&name2=value2" http://www.baidu.com |
linux curl post方式提交數據:
1
2
|
curl
-d
"name=value&name2=value2"
http://www.baidu.com
#post數據
curl
-d
a=b&c=d&txt@/tmp/txt
http://www.baidu.com #post文件
|
以表單的方式上傳文件:
1 | curl -F file=@/tmp/me.txt http://www.aiezu.com |
相當於設置form表單的method="POST"和enctype='multipart/form-data'兩個屬性。
5. linux curl http header處理:
設置http請求頭信息:
1
2
3
|
curl
-A
"Mozilla/5.0 Firefox/21.0"
http://www.baidu.com
#設置http請求頭User-Agent
curl
-e
"http://pachong.org/"
http://www.baidu.com
#設置http請求頭Referer
curl
-H
"Connection:keep-alive \n User-Agent: Mozilla/5.0"
http://www.aiezu.com
|
設置http響應頭處理:
1 2 | curl -I http://www.aiezu.com #僅僅返回header curl -D /tmp/header http://www.aiezu.com #將http header保存到/tmp/header文件 |
6. linux curl認證:
1
2
|
curl
-u
aiezu:password
http://www.aiezu.com
#用戶名密碼認證
curl
-E
mycert.pem
https://www.baidu.com
#採用證書認證
|
6. 其他:
1
2
|
curl
-#
http://www.baidu.com #以“#”號輸出進度條
curl
-o
/tmp/aiezu
http://www.baidu.com
#保存http響應到/tmp/aiezu
|
轉載: http://www.aiezu.com/system/linux/linux_curl_syntax.html