在上一篇文章中,我們學習到了如何使用HttpClient發送HTTP請求。博文鏈接:
Android系列之網絡(一)—-使用HttpClient發送HTTP請求
本篇文章中,將學習一下HTTP請求頭與響應頭的知識。
一、HTTP頭引入:
正確的設置HTTP頭部信息有助於搜索引擎判斷網頁及提升網站訪問速度。通常HTTP消息包括:客戶機向服務器的請求消息和服務器向客戶機的響應消息。客戶端向服務器發送一個請求,請求頭包含請求的方法、URI、協議版本、以及包含請求修飾符、客戶信息和內容的類似於MIME的消息結構。服務器以一個狀態行作爲響應,相應的內容包括消息協議的版本,成功或者錯誤編碼加上包含服務器信息、實體元信息以及可能的實體內容。
Http協議定義了很多與服務器交互的方法,即HTTP請求的種類中,最基本的有4種,分別是GET、POST、PUT、DELETE。一個URL地址用於描述一個網絡上的資源,而HTTP中GET、POST、PUT、 DELETE就對應着對這個資源的查、改、增、刪4個操作,我們最常見的就是GET和POST了。
- GET:通過請求URI得到資源。一般用於獲取/查詢資源信息。
- POST:用於向服務器提交新的內容。一般用於更新資源信息。
二、HTTP頭信息解讀:
HTTP的頭域包括通用頭、請求頭、響應頭和實體頭四個部分。每個頭域由一個域名,冒號(:)和域值三部分組成(說白了就是鍵值對)。
- 通用頭:是客戶端和服務器都可以使用的頭部,可以在客戶端、服務器和其他應用程序之間提供一些非常有用的通用功能,如Date頭部。
- 請求頭:是請求報文特有的,它們爲服務器提供了一些額外信息,比如客戶端希望接收什麼類型的數據,如Accept頭部。
- 響應頭:便於客戶端提供信息,比如,客服端在與哪種類型的服務器進行交互,如Server頭部。
- 實體頭:指的是用於應對實體主體部分的頭部,比如,可以用實體頭部來說明實體主體部分的數據類型,如Content-Type頭部。
三、HTTP通用頭:
通用頭域包含請求和響應消息都支持的頭域,通用頭域包含緩存頭部Cache-Control、Pragma及信息性頭部Connection、Date、Transfer-Encoding、Update、Via。
1、Cache-Control
Cache-Control指定請求和響應遵循的緩存機制。在請求消息或響應消息中設置 Cache-Control並不會修改另一個消息處理過程中的緩存處理過程。請求時的緩存指令包括no-cache、no-store、max-age、 max-stale、min-fresh、only-if-cached,響應消息中的指令包括public、private、no-cache、no- store、no-transform、must-revalidate、proxy-revalidate、max-age。各個消息中的指令含義如下:
- no-cache:指示請求或響應消息不能緩存,實際上是可以存儲在本地緩存區中的,只是在與原始服務器進行新鮮度驗證之前,緩存不能將其提供給客戶端使用。
- no-store:緩存應該儘快從存儲器中刪除文檔的所有痕跡,因爲其中可能會包含敏感信息。
- max-age:緩存無法返回緩存時間長於max-age規定秒的文檔,若不超規定秒瀏覽器將不會發送對應的請求到服務器,數據由緩存直接返回;超過這一時間段才進一步由服務器決定是返回新數據還是仍由緩存提供。若同時還發送了max-stale指令,則使用期可能會超過其過期時間。
- min-fresh:至少在未來規定秒內文檔要保持新鮮,接受其新鮮生命期大於其當前 Age 跟 min-fresh 值之和的緩存對象。
- max-stale:指示客戶端可以接收過期響應消息,如果指定max-stale消息的值,那麼客戶端可以接收過期但在指定值之內的響應消息。
- only-if-cached:只有當緩存中有副本存在時,客戶端纔會獲得一份副本。
- Public:指示響應可被任何緩存區緩存,可以用緩存內容迴應任何用戶。
- Private:指示對於單個用戶的整個或部分響應消息,不能被共享緩存處理,只能用緩存內容迴應先前請求該內容的那個用戶。
2、Pragma
Pragma頭域用來包含實現特定的指令,最常用的是Pragma:no-cache。在HTTP/1.1協議中,它的含義和Cache- Control:no-cache相同。
3、Connection
Connection表示是否需要持久連接。如果Servlet看到這裏的值爲“Keep-Alive”,或者看到請求使用的是HTTP 1.1(HTTP 1.1默認進行持久連接),它就可以利用持久連接的優點,當頁面包含多個元素時(例如Applet,圖片),顯著地減少下載所需要的時間。要實現這一點,Servlet需要在應答中發送一個Content-Length頭,最簡單的實現方法是:先把內容寫入ByteArrayOutputStream,然後在正式寫出內容之前計算它的大小。
- Close:告訴WEB服務器或者代理服務器,在完成本次請求的響應後,斷開連接,不要等待本次連接的後續請求了。
- Keepalive:告訴WEB服務器或者代理服務器,在完成本次請求的響應後,保持連接,等待本次連接的後續請求。
- Keep-Alive:如果瀏覽器請求保持連接,則該頭部表明希望 WEB 服務器保持連接多長時間(秒),如Keep-Alive:300。
4、Date
Date頭域表示消息發送的時間,服務器響應中要包含這個頭部,因爲緩存在評估響應的新鮮度時要用到,其時間的描述格式由RFC822定義。例如,Date:Mon, 31 Dec 2001 04:25:57 GMT。Date描述的時間表示世界標準時,換算成本地時間,需要知道用戶所在的時區。
5、Transfer-Encoding
WEB 服務器表明自己對本響應消息體(不是消息體裏面的對象)作了怎樣的編碼,比如是否分塊(chunked),例如:Transfer-Encoding: chunked
6、Upgrade
它可以指定另一種可能完全不同的協議,如HTTP/1.1客戶端可以向服務器發送一條HTTP/1.0請求,其中包含值爲“HTTP/1.1”的Update頭部,這樣客戶端就可以測試一下服務器是否也使用HTTP/1.1了。
7、Via
列出從客戶端到 OCS 或者相反方向的響應經過了哪些代理服務器,他們用什麼協議(和版本)發送的請求。
當客戶端請求到達第一個代理服務器時,該服務器會在自己發出的請求裏面添加 Via 頭部,並填上自己的相關信息,當下一個代理服務器 收到第一個代理服務器的請求時,會在自己發出的請求裏面複製前一個代理服務器的請求的Via頭部,並把自己的相關信息加到後面,以此類推,當 OCS 收到最後一個代理服務器的請求時,檢查 Via 頭部,就知道該請求所經過的路由。例如:Via:1.0 236-81.D07071953.sina.com.cn:80 (squid/2.6.STABLE13)
四、HTTP請求頭:
請求頭用於說明是誰或什麼在發送請求、請求源於何處,或者客戶端的喜好及能力。服務器可以根據請求頭部給出的客戶端信息,試着爲客戶端提供更好的響應。請求頭域可能包含下列字段Accept、Accept-Charset、Accept- Encoding、Accept-Language、Authorization、From、Host、If-Modified-Since、If-Match、If-None-Match、If-Range、If-Range、If-Unmodified-Since、Max-Forwards、Proxy-Authorization、Range、Referer、User-Agent。對請求頭域的擴展要求通訊雙方都支持,如果存在不支持的請求頭域,一般將會作爲實體頭域處理。
8、Accept
告訴WEB服務器自己接受什麼介質類型,*/* 表示任何類型,type/* 表示該類型下的所有子類型,type/sub-type。
9、Accept-Charset
瀏覽器告訴服務器自己能接收的字符集。
10、Accept-Encoding
瀏覽器申明自己接收的編碼方法,通常指定壓縮方法,是否支持壓縮,支持什麼壓縮方法(gzip,deflate)。
11、Accept-Language
瀏覽器申明自己接收的語言。語言跟字符集的區別:中文是語言,中文有多種字符集,比如big5,gb2312,gbk等等。
12、Authorization
當客戶端接收到來自WEB服務器的 WWW-Authenticate 響應時,用該頭部來回應自己的身份驗證信息給WEB服務器。
13、If-Match
如果對象的 ETag 沒有改變,其實也就意味著對象沒有改變,才執行請求的動作,獲取文檔。
14、If-None-Match
如果對象的 ETag 改變了,其實也就意味著對象也改變了,才執行請求的動作,獲取文檔。
15、If-Modified-Since
如果請求的對象在該頭部指定的時間之後修改了,才執行請求的動作(比如返回對象),否則返回代碼304,告訴瀏覽器該對象沒有修改。例如:If-Modified-Since:Thu, 10 Apr 2008 09:14:42 GMT
16、If-Unmodified-Since
如果請求的對象在該頭部指定的時間之後沒修改過,才執行請求的動作(比如返回對象)。
17、If-Range
瀏覽器告訴 WEB 服務器,如果我請求的對象沒有改變,就把我缺少的部分給我,如果對象改變了,就把整個對象給我。瀏覽器通過發送請求對象的ETag 或者自己所知道的最後修改時間給 WEB 服務器,讓其判斷對象是否改變了。總是跟 Range 頭部一起使用。
18、Range
瀏覽器(比如 Flashget 多線程下載時)告訴 WEB 服務器自己想取對象的哪部分。例如:Range: bytes=1173546
19、Proxy-Authenticate
代理服務器響應瀏覽器,要求其提供代理身份驗證信息。
20、Proxy-Authorization
瀏覽器響應代理服務器的身份驗證請求,提供自己的身份信息。
21、Host
客戶端指定自己想訪問的WEB服務器的域名/IP 地址和端口號。如Host:rss.sina.com.cn
22、Referer
瀏覽器向WEB 服務器表明自己是從哪個網頁URL獲得點擊當前請求中的網址/URL,例如:Referer:http://www.ecdoer.com/
23、User-Agent
瀏覽器表明自己的身份(是哪種瀏覽器)。例如:Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1985.143 Safari/537.36
五、HTTP響應頭:
響應頭向客戶端提供一些額外信息,比如誰在發送響應、響應者的功能,甚至與響應相關的一些特殊指令。這些頭部有助於客戶端處理響應,並在將來發起更好的請求。響應頭域包含Age、Location、Proxy-Authenticate、Public、Retry- After、Server、Vary、Warning、WWW-Authenticate。對響應頭域的擴展要求通訊雙方都支持,如果存在不支持的響應頭域,一般將會作爲實體頭域處理。
24、Age
當代理服務器用自己緩存的實體去響應請求時,用該頭部表明該實體從產生到現在經過多長時間了。
25、Server
WEB 服務器表明自己是什麼軟件及版本等信息。例如:Server:Apache/2.0.61 (Unix)
26、Accept-Ranges
WEB服務器表明自己是否接受獲取其某個實體的一部分(比如文件的一部分)的請求。bytes:表示接受,none:表示不接受。
27、Vary
WEB服務器用該頭部的內容告訴 Cache 服務器,在什麼條件下才能用本響應所返回的對象響應後續的請求。假如源WEB服務器在接到第一個請求消息時,其響應消息的頭部爲:Content-Encoding: gzip; Vary: Content-Encoding,那麼Cache服務器會分析後續請求消息的頭部,檢查其Accept-Encoding,是否跟先前響應的Vary頭部值一致,即是否使用相同的內容編碼方法,這樣就可以防止Cache服務器用自己Cache 裏面壓縮後的實體響應給不具備解壓能力的瀏覽器。例如:Vary:Accept-Encoding。
六、HTTP實體頭:
實體頭部提供了有關實體及其內容的大量信息,從有關對象類型的信息,到能夠對資源使用的各種有效的請求方法。總之,實體頭部可以告知接收者它在對什麼進行處理。請求消息和響應消息都可以包含實體信息,實體信息一般由實體頭域和實體組成。實體頭域包含關於實體的原信息,實體頭包括信息性頭部Allow、Location,內容頭部Content-Base、Content-Encoding、Content-Language、Content-Length、Content-Location、Content-MD5、Content-Range、Content-Type,緩存頭部Etag、Expires、Last-Modified、extension-header。
28、Allow
服務器支持哪些請求方法(如GET、POST等)。
29、Location
表示客戶應當到哪裏去提取文檔,用於將接收端定位到資源的位置(URL)上。Location通常不是直接設置的,而是通過HttpServletResponse的sendRedirect方法,該方法同時設置狀態代碼爲302。
30、Content-Base
解析主體中的相對URL時使用的基礎URL。
31、Content-Encoding
WEB服務器表明自己使用了什麼壓縮方法(gzip,deflate)壓縮響應中的對象。例如:Content-Encoding:gzip
32、Content-Language
WEB 服務器告訴瀏覽器理解主體時最適宜使用的自然語言。
33、Content-Length
WEB服務器告訴瀏覽器自己響應的對象的長度或尺寸,例如:Content-Length: 26012
34、Content-Location
資源實際所處的位置。
35、Content-MD5
主體的MD5校驗和。
36、Content-Range
實體頭用於指定整個實體中的一部分的插入位置,他也指示了整個實體的長度。在服務器向客戶返回一個部分響應,它必須描述響應覆蓋的範圍和整個實體長度。一般格式: Content-Range:bytes-unitSPfirst-byte-pos-last-byte-pos/entity-legth。例如,傳送頭500個字節次字段的形式:Content-Range:bytes0- 499/1234如果一個http消息包含此節(例如,對範圍請求的響應或對一系列範圍的重疊請求),Content-Range表示傳送的範圍,Content-Length表示實際傳送的字節數。
37、Content-Type
WEB 服務器告訴瀏覽器自己響應的對象的類型。例如:Content-Type:application/xml
38、Etag
就是一個對象(比如URL)的標誌值,就一個對象而言,比如一個html文件,如果被修改了,其Etag也會別修改,所以,ETag的作用跟Last-Modified的作用差不多,主要供WEB服務器判斷一個對象是否改變了。比如前一次請求某個html文件時,獲得了其 ETag,當這次又請求這個文件時,瀏覽器就會把先前獲得ETag值發送給WEB服務器,然後WEB服務器會把這個ETag跟該文件的當前ETag進行對比,然後就知道這個文件有沒有改變了。
39、Expires
WEB服務器表明該實體將在什麼時候過期,對於過期了的對象,只有在跟WEB服務器驗證了其有效性後,才能用來響應客戶請求。是 HTTP/1.0 的頭部。例如:Expires:Sat, 23 May 2009 10:02:12 GMT
40、Last-Modified
WEB服務器認爲對象的最後修改時間,比如文件的最後修改時間,動態頁面的最後產生時間等等。例如:Last-Modified:Tue, 06 May 2008 02:42:43 GMT
六、以百度首頁爲例獲取請求頭和響應頭內容:
1、請求頭:
我們現在通過谷歌瀏覽器來查看一下請求頭:
以打開百度首頁爲例,然後在谷歌瀏覽器中打開“工具-開發者工具”,切換到network標籤, 然後刷新頁面:
上圖中,打開箭頭處html格式的文件,顯示如下:
上圖中的Request Headers就是我們所需要的請求頭。裏面的內容全部是鍵值對。服務器拿到這些鍵值對後會對其進行分析。
我們再來重複一下常見請求頭鍵值對的含義:
- Host:www.baidu.com 本次請求訪問的主機地址
- Cache-control:no-cache 設置網頁緩存的使用方法
- Pragma:no-cache
- Accept:text/html,xxxxxx…..客戶端希望接收什麼類型的數據
- User-Agent:Mozilla/5.0xxxxx 主要表示客戶端類型
- Accept-Encoding:gzip,deflate,sdch 瀏覽器能夠夠解碼的數據編碼方式
- Accept-Language:zh-CN,zh;q=0.8 瀏覽器期望的接受的語言種類
注:上面的這些指的是get請求的請求頭。
2、響應頭:
我們再來看一下響應頭的內容:
常見的響應頭鍵值對的含義:
- Content-Encoding 返回數據的壓縮格式
- Content-Length 返回數據量的大小
- Content-Type 返回數據的類型
- Last-Modified 資源最後一次修改的時間
- Date 返回數據的時間
- Server 服務器類型
七、通過Android代碼獲取請求頭與相應頭的內容:
在上一篇文章中,我們講到了使用HttpClient發送HTTP請求。我們將裏面的代碼重新複製一下貼出來:(省的切換回去,麻煩的很)
activity_main.xml代碼如下:
xmlns:tools=”http://schemas.android.com/tools”
android:layout_width=”match_parent”
android:layout_height=”match_parent”
android:orientation=”vertical”
tools:context=”.MainActivity” >
<Button
android:id=”@+id/button1″
android:layout_width=”match_parent”
android:layout_height=”wrap_content”
android:text=”Send Request” />
<ScrollView
android:layout_width=”match_parent”
android:layout_height=”match_parent” >
<TextView
android:id=”@+id/TextView1″
android:layout_width=”match_parent”
android:layout_height=”wrap_content”
android:text=”@string/hello_world” />
</ScrollView>
</LinearLayout>
佈局文件中,我們用一個ScrollView來包裹TextView。藉助ScrollView控件的話,就可以允許我們一滾動的形式查看屏幕外i的那部分內容。
MainActivity.java的代碼如下:(註釋比較詳細)
2
3 import org.apache.http.HttpEntity;
4 import org.apache.http.HttpResponse;
5 import org.apache.http.client.HttpClient;
6 import org.apache.http.client.methods.HttpGet;
7 import org.apache.http.impl.client.DefaultHttpClient;
8 import org.apache.http.util.EntityUtils;
9 import android.app.Activity;
10 import android.os.Bundle;
11 import android.os.Handler;
12 import android.os.Message;
13 import android.view.View;
14 import android.view.View.OnClickListener;
15 import android.widget.Button;
16 import android.widget.TextView;
17
18 public class MainActivity extends Activity {
19
20 public static final int SHOW_RESPONSE = 0;
21
22 private Button button_sendRequest;
23 private TextView textView_response;
24
25 //新建Handler的對象,在這裏接收Message,然後更新TextView控件的內容
26 private Handler handler = new Handler() {
27
28 @Override
29 public void handleMessage(Message msg) {
30 super.handleMessage(msg);
31 switch (msg.what) {
32 case SHOW_RESPONSE:
33 String response = (String) msg.obj;
34 textView_response.setText(response);
35 break;
36
37 default:
38 break;
39 }
40 }
41
42 };
43
44 @Override
45 protected void onCreate(Bundle savedInstanceState) {
46 super.onCreate(savedInstanceState);
47 setContentView(R.layout.activity_main);
48 textView_response = (TextView)findViewById(R.id.TextView1);
49 button_sendRequest = (Button)findViewById(R.id.button1);
50
51 button_sendRequest.setOnClickListener(new OnClickListener() {
52
53 //點擊按鈕時,執行sendRequestWithHttpClient()方法裏面的線程
54 @Override
55 public void onClick(View v) {
56 // TODO Auto-generated method stub
57 sendRequestWithHttpClient();
58 }
59 });
60 }
61
62 //方法:發送網絡請求,獲取百度首頁的數據。在裏面開啓線程
63 private void sendRequestWithHttpClient() {
64 new Thread(new Runnable() {
65
66 @Override
67 public void run() {
68 //用HttpClient發送請求,分爲五步
69 //第一步:創建HttpClient對象
70 HttpClient httpCient = new DefaultHttpClient();
71 //第二步:創建代表請求的對象,參數是訪問的服務器地址
72 HttpGet httpGet = new HttpGet(“http://www.baidu.com”);
73
74 try {
75 //第三步:執行請求,獲取服務器發還的相應對象
76 HttpResponse httpResponse = httpCient.execute(httpGet);
77 //第四步:檢查響應的狀態是否正常:檢查狀態碼的值是200表示正常
78 if (httpResponse.getStatusLine().getStatusCode() == 200) {
79 //第五步:從響應對象當中取出數據,放到entity當中
80 HttpEntity entity = httpResponse.getEntity();
81 String response = EntityUtils.toString(entity,”utf-8″);//將entity當中的數據轉換爲字符串
82
83 //在子線程中將Message對象發出去
84 Message message = new Message();
85 message.what = SHOW_RESPONSE;
86 message.obj = response.toString();
87 handler.sendMessage(message);
88 }
89
90 } catch (Exception e) {
91 // TODO Auto-generated catch block
92 e.printStackTrace();
93 }
94
95 }
96 }).start();//這個start()方法不要忘記了
97
98 }
99 }
這段代碼要實現的功能是:用戶點擊按鈕,能夠獲取百度首頁的html數據並顯示在TextView當中。
現在要做的事情是:修改上方代碼中sendRequestWithHttpClient()這個方法裏面的內容:
2 private void sendRequestWithHttpClient() {
3 new Thread(new Runnable() {
4
5 @Override
6 public void run() {
7 //用HttpClient發送請求,分爲五步
8 HttpClient httpCient = new DefaultHttpClient();
9 HttpGet httpGet = new HttpGet(“http://www.baidu.com”);
10
11 //放入請求頭的內容,必須是以鍵值對的形式,這裏以Accept-language爲例
12 httpGet.addHeader(“Accept-Language”,”zh-CN,zh;q=0.8,en;q=0.6,zh-TW;q=0.4″);
13 //獲取請求頭,並用Header數組接收
14 Header [] reqHeaders = httpGet.getAllHeaders();
15 //遍歷Header數組,並打印出來
16 for (int i = 0; i < reqHeaders.length; i++) {
17 String name = reqHeaders[i].getName();
18 String value = reqHeaders[i].getValue();
19 Log.d(“http01″, “Http request: Name—>” + name + “,Value—>” + value);
20 }
21
22 try {
23 HttpResponse httpResponse = httpCient.execute(httpGet);
24
25 //獲取響應頭,並用Header數組接收
26 Header [] responseHeaders = httpResponse.getAllHeaders();
27 //遍歷Header數組,並打印出來
28 for (int i = 0; i < responseHeaders.length; i++) {
29 String name = responseHeaders[i].getName();
30 String value = responseHeaders[i].getValue();
31 Log.d(“http01″, “Http response: Name—>” + name + “,Value—>” + value);
32 }
33
34 if (httpResponse.getStatusLine().getStatusCode() == 200) {
35 HttpEntity entity = httpResponse.getEntity();
36 String response = EntityUtils.toString(entity,”utf-8″);//將entity當中的數據轉換爲字符串
37
38 //在子線程中將Message對象發出去
39 Message message = new Message();
40 message.what = SHOW_RESPONSE;
41 message.obj = response.toString();
42 handler.sendMessage(message);
43 }
44
45 } catch (Exception e) {
46 // TODO Auto-generated catch block
47 e.printStackTrace();
48 }
49
50 }
51 }).start();//這個start()方法不要忘記了
52
53 }
上方代碼中,加粗部分是我們所添加的內容,用於獲取請求頭和響應頭的鍵值對內容。代碼解釋如下:
12行:通過httpGet的addHeader()方法手動添加一個請求頭(我們在上一段中看到的例子其實是瀏覽器幫我們添加好了的,那種情況下不需要手動添加)
14行:通過httpGet的getAllHeaders()方法獲取響應頭的內容,並用Header數組接收。注意,在導入Header的包時,我們選擇org.apache.http.Header這個包;請求頭的每一個鍵值對都是Header裏面的內容。
16至20行:遍歷輸出Header數組裏面的內容。
25至32行:獲取響應頭的內容,原理類似。
運行程序,點擊按鈕後,在後臺輸出結果如下:
這與我們在上一段中看到的許多鍵是一樣的。
【工程文件】
鏈接:http://pan.baidu.com/s/1ntHTYPz
密碼:g8vk
參考鏈接:
http://www.ecdoer.com/post/http-seo.html
http://blog.csdn.net/kfanning/article/details/6062118
文章來源:http://www.cnblogs.com/smyhvae/p/4044170.html