都2019年了,還問http中GET和POST的區別

最近看了一些同學的面經,發現無論什麼技術崗位,還是會問到 get 和 post 的區別,而搜索出來的答案並不能讓我們裝得一手好逼,那就讓我們從 HTTP 報文的角度來擼一波,從而搞明白他們的區別

1、前言

最近看了一些同學的面經,發現無論什麼技術崗位,還是會問到 get 和 post 的區別,而搜索出來的答案並不能讓我們裝得一手好逼,那就讓我們從 HTTP 報文的角度來擼一波,從而搞明白他們的區別。

2、標準答案

在開擼之前嗎,讓我們先看一下標準答案長什麼樣子 w3school: GET 對比 POST。標準答案很美好,但是在面試的時候把下面的表格甩面試官一臉,估計會裝逼不成反被*。

分類 GET POST
後退按鈕/刷新 無害 數據會被重新提交(瀏覽器應該告知用戶數據會被重新提交)。
書籤 可收藏爲書籤 不可收藏爲書籤
緩存 能被緩存 不能緩存
編碼類型 application/x-www-form-urlencoded application/x-www-form-urlencoded 或 multipart/form-data。爲二進制數據使用多重編碼。
歷史 參數保留在瀏覽器歷史中。 參數不會保存在瀏覽器歷史中。
對數據長度的限制 是的。當發送數據時,GET 方法向 URL 添加數據;URL 的長度是受限制的(URL 的最大長度是 2048 個字符)。 無限制。
對數據類型的限制 只允許 ASCII 字符。 沒有限制。也允許二進制數據。
安全性 與 POST 相比,GET 的安全性較差,因爲所發送的數據是 URL 的一部分。在發送密碼或其他敏感信息時絕不要使用 GET ! POST 比 GET 更安全,因爲參數不會被保存在瀏覽器歷史或 web 服務器日誌中。
可見性 數據在 URL 中對所有人都是可見的。 數據不會顯示在 URL 中。

注意,並不是說標準答案有誤,上述區別在大部分瀏覽器上是存在的,因爲這些瀏覽器實現了 HTTP 標準。但是,前面列舉的只是瀏覽器實現上的區別,而不是 get 和 post 的本質區別。

3、GET 和 POST 報文上的區別

先下結論,GET 和 POST 方法沒有實質區別,只是報文格式不同。

GET 和 POST 只是 HTTP 協議中兩種請求方式,而 HTTP 協議是基於 TCP/IP 的應用層協議,無論 GET 還是 POST,用的都是同一個傳輸層協議,所以在傳輸上,沒有區別。

報文格式上,不帶參數時,最大區別就是第一行方法名不同

POST方法請求報文第一行是這樣的 POST /uri HTTP/1.1 \r\n

GET方法請求報文第一行是這樣的 GET /uri HTTP/1.1 \r\n

是的,不帶參數時他們的區別就僅僅是報文的前幾個字符不同而已

帶參數時報文的區別呢? 在約定中,GET 方法的參數應該放在 url 中,POST 方法參數應該放在 body 中

舉個例子,如果參數是 name=chengqm, age=22。

GET 方法簡約版報文是這樣的

GET /index.php?name=qiming.c&age=22 HTTP/1.1
Host: localhost

POST 方法簡約版報文是這樣的

POST /index.php HTTP/1.1
Host: localhost
Content-Type: application/x-www-form-urlencoded

name=qiming.c&age=22

現在我們知道了兩種方法本質上是 TCP 連接,沒有差別,也就是說,如果我不按規範來也是可以的。我們可以在 URL 上寫參數,然後方法使用 POST;也可以在 Body 寫參數,然後方法使用 GET。當然,這需要服務端支持。

4、常見問題

GET 方法參數寫法是固定的嗎?
在約定中,我們的參數是寫在 ? 後面,用 & 分割。

我們知道,解析報文的過程是通過獲取 TCP 數據,用正則等工具從數據中獲取 Header 和 Body,從而提取參數。

也就是說,我們可以自己約定參數的寫法,只要服務端能夠解釋出來就行,一種比較流行的寫法是 http://www.example.com/user/name/chengqm/age/22

POST 方法比 GET 方法安全?

按照網上大部分文章的解釋,POST 比 GET 安全,因爲數據在地址欄上不可見。

然而,從傳輸的角度來說,他們都是不安全的,因爲 HTTP 在網絡上是明文傳輸的,只要在網絡節點上捉包,就能完整地獲取數據報文。

要想安全傳輸,就只有加密,也就是 HTTPS

GET 方法的長度限制是怎麼回事?

在網上看到很多關於兩者區別的文章都有這一條,提到瀏覽器地址欄輸入的參數是有限的。

首先說明一點,HTTP 協議沒有 Body 和 URL 的長度限制,對 URL 限制的大多是瀏覽器和服務器的原因。

瀏覽器原因就不說了,服務器是因爲處理長 URL 要消耗比較多的資源,爲了性能和安全(防止惡意構造長 URL 來攻擊)考慮,會給 URL 長度加限制。

POST 方法會產生兩個TCP數據包?

有些文章中提到,post 會將 header 和 body 分開發送,先發送 header,服務端返回 100 狀態碼再發送 body。

HTTP 協議中沒有明確說明 POST 會產生兩個 TCP 數據包,而且實際測試(Chrome)發現,header 和 body 不會分開發送。

所以,header 和 body 分開發送是部分瀏覽器或框架的請求方法,不屬於 post 必然行爲。

5、talk is cheap show me the code

如果對 get 和 post 報文區別有疑惑,直接起一個 Socket 服務端,然後封裝簡單的 HTTP 處理方法,直接觀察和處理 HTTP 報文,就能一目瞭然

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import socket

HOST, PORT = '', 23333


def server_run():
  listen_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
  listen_socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
  listen_socket.bind((HOST, PORT))
  listen_socket.listen(1)
  print('Serving HTTP on port %s ...' % PORT)
  while True:
    # 接受連接
    client_connection, client_address = listen_socket.accept()
    handle_request(client_connection)


def handle_request(client_connection):
  # 獲取請求報文
  request = ''
  while True:
    recv_data = client_connection.recv(2400)
    recv_data = recv_data.decode()
    request += recv_data
    if len(recv_data) < 2400:
      break

  # 解析首行
  first_line_array = request.split('\r\n')[0].split(' ')

  # 分離 header 和 body
  space_line_index = request.index('\r\n\r\n')
  header = request[0: space_line_index]
  body = request[space_line_index + 4:]

  # 打印請求報文
  print(request)

  # 返回報文
  http_response = b"""\
HTTP/1.1 200 OK

<!DOCTYPE html>
<html>
<head>
  <title>Hello, World!</title>
</head>
<body>
<p style="color: green">Hello, World!</p>
</body>
</html>
"""
  client_connection.sendall(http_response)
  client_connection.close()


if __name__ == '__main__':
  server_run()

上面代碼就是簡單的打印請求報文然後返回 HelloWorld 的 html 頁面,我們運行起來

[root@chengqm shell]# python httpserver.py
Serving HTTP on port 23333 ...

然後從瀏覽器中請求看看

打印出來的報文

然後就可以手動證明上述說法,比如說要測試 header 和 body 是否分開傳輸,由於代碼沒有返回 100 狀態碼,如果我們 post 請求成功就說明是一起傳輸的(Chrome/postman)。

又比如 w3school 裏面說 URL 的最大長度是 2048 個字符,那我們在代碼裏面加上一句計算 uri 長度的代碼

...
# 解析首行
first_line_array = request.split('\r\n')[0].split(' ')
print('uri長度: %s' % len(first_line_array[1]))
...

我們用 postman 直接發送超過 2048 個字符的請求看看

然後我們可以得出結論,url 長度限制是某些瀏覽器和服務器的限制,和 HTTP 協議沒有關係。

到此,我們可以愉快地裝逼了 :)

參考:

  1. 99%的人都理解錯了HTTP中GET與POST的區別
  2. 關於HTTP GET 和 POST
  3. w3school: HTTP 方法:GET 對比 POST
  4. wikipedia: 超文本傳輸協議
  5. RFC 2068

這篇文章就介紹到這了,關於更多http中GET和POST的區別,請大家可以看神馬文庫以前發佈的文章。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章