一臺 Web 服務器可搭建多個獨立域名的 Web 網站,也可作爲通信路徑上的中轉服務器提升傳輸效率。
5.1 用單臺虛擬主機實現多個域名
HTTP/1.1 規範允許一臺 HTTP 服務器搭建多個 Web 站點。比如,提供 Web 託管服務(Web Hosting
Service)的供應商,可以用一臺服務器爲多位客戶服務,也可以以每位客戶持有的域名運行各自不同的網站。這是因爲利用了虛擬主機(Virtual Host,又稱虛擬服務器)的功能。
在互聯網上,域名通過 DNS 服務映射到 IP 地址(域名解析)之後訪問目標網站。可見,當請求發送到服務器時,已經是以 IP 地址形式訪問了。所以,如果一臺服務器內託管了 www.tricorder.jp 和 www.hackr.jp 這兩個域名,當收到請求時就需要清楚究竟要訪問哪個域名。
在相同的 IP 地址下,由於虛擬主機可以寄存多個不同主機名和域名的 Web 網站,因此在發送 HTTP 請求時,必須在 Host 首部內完整指定主機名或域名的 URI。
5.2 通信數據轉發程序 :代理、網關、隧道
- 代理:代理是一種有轉發功能的應用程序,它扮演了位於服務器和客戶端“中間人”的角色,接收由客戶端發送的請求並轉發給服務器,同時也接收服務器返回的響應並轉發給客戶端。
- 網關:網關是轉發其他服務器通信數據的服務器,接收從客戶端發送來的請求時,它就像自己擁有資源的源服務器一樣對請求進行處理。有時客戶端可能都不會察覺,自己的通信目標是一個網關。
- 隧道:隧道是在相隔甚遠的客戶端和服務器兩者之間進行中轉,並保持雙方通信連接的應用程序。
5.2.1 代理
代理服務器的基本行爲就是接收客戶端發送的請求後轉發給其他服務器。代理不改變請求 URI,會直接發送給前方持有資源的目標服務器。持有資源實體的服務器被稱爲源服務器。從源服務器返回的響應經過代理服務器後再傳給客戶端。
使用代理服務器的理由有:利用緩存技術(稍後講解)減少網絡帶寬的流量,組織內部針對特定網站的訪問控制,以獲取訪問日誌爲主要目的,等等。代理有多種使用方法,按兩種基準分類。一種是是否使用緩存,另一種是是否會修改報文。
- 緩存代理:代理轉發響應時,緩存代理(Caching Proxy)會預先將資源的副本(緩存)保存在代理服務器上。當代理再次接收到對相同資源的請求時,就可以不從源服務器那裏獲取資源,而是將之前緩存的資源作爲響應返回。
- 透明代理:轉發請求或響應時,不對報文做任何加工的代理類型被稱爲透明代理(Transparent Proxy)。反之,對報文內容進行加工的代理被稱爲非透明代理。
5.2.2 網關
網關的工作機制和代理十分相似。而網關能使通信線路上的服務器提供非 HTTP 協議服務。利用網關能提高通信的安全性,因爲可以在客戶端與網關之間的通信線路上加密以確保連接的安全。比如,網關可以連接數據庫,使用 SQL 語句查詢數據。另外,在 Web 購物網站上進行信用卡結算時,網關可以和信用卡結算系統聯動。
5.2.3 隧道
隧道可按要求建立起一條與其他服務器的通信線路,屆時使用 SSL 等加密手段進行通信。隧道的目的是確保客戶端能與服務器進行安全的通信。隧道本身不會去解析 HTTP 請求。也就是說,請求保持原樣中轉給之後的服務器。隧道會在通信雙方斷開連接時結束。
5.3 保存資源的緩存
緩存是指代理服務器或客戶端本地磁盤內保存的資源副本。利用緩存可減少對源服務器的訪問,因此也就節省了通信流量和通信時間。
緩存服務器的優勢在於利用緩存可避免多次從源服務器轉發資源。因此客戶端可就近從緩存服務器上獲取資源,而源服務器也不必多次處理相同的請求了。
5.3.1 緩存的有效期限
即便緩存服務器內有緩存,也不能保證每次都會返回對同資源的請求。因爲這關係到被緩存資源的有效性問題。即使存在緩存,也會因爲客戶端的要求、緩存的有效期等因素,向源服務器確認資源的有效性。若判斷緩存失效,緩存服務器將會再次從源服務器上獲取“新”資源。
5.3.2 客戶端的緩存
緩存不僅可以存在於緩存服務器內,還可以存在客戶端瀏覽器中。以 Internet Explorer 程序爲例,把客戶端緩存稱爲臨時網絡文件(Temporary Internet File)。瀏覽器緩存如果有效,就不必再向服務器請求相同的資源了,可以直接從本地磁盤內讀取。另外,和緩存服務器相同的一點是,當判定緩存過期後,會向源服務器確認資源的有效性。若判斷瀏覽器緩存失效,瀏覽器會再次請求新資源。