瞭解互聯網(Internet)與萬維網(World Wide Web)的技術內涵

那現在我們來打開互聯網的內部,來看一看互聯網內部的結構是什麼樣子。我相信大家理解了互聯網的內部結構,對互聯網形成連接這樣一個概念也會有更深刻的體會。

互聯網指的是通過TCP/IP協議族相互連接在一起的計算機的網絡。TCP是Transmission Control Protocol,傳輸控制協議;IP是Internet Protocol,網際協議。TCP/IP協議族是一個網絡通訊模型,是當前互聯網通訊的基礎架構。

IP用來去識別網絡上的一臺計算機。計算機要連接到一起相互通信,首先需要知道連接的目標計算機,而IP就能標識一臺計算機。做一個類比,我們人跟人之間也需要建立連接才能交流,在一羣人中說話,首先喊出一個人的名字,他就知道你在跟他說話了。IP就是計算機的名字。

TCP是計算機之間控制傳輸信息的協議,同樣的類比,就是人與人之間溝通的語言和方式。一個不會外語的中國人跟一個美國人交流是無效的,就跟好像一臺計算機發送目標計算機無法識別的數據包。能夠識別出網絡上的計算機,同時也能以相互理解的方式進行通訊,這樣計算機就可以連接到一起了。

Clipboard Image.png

互聯網的發展歷史

接下來我們回顧一下互聯網的發展過程。戰爭往往是科技發展的原動力互聯網也不例外。互聯網誕生於冷戰時期,美國國防部研製的APANET是互聯網的原型,那時主要用來傳遞戰爭情報的。這個時期分組交換技術得到了發展,分組交換的意思就是完整的數據如何拆分成一個個數據包分開傳輸,接收之後就重新組裝的技術。

Clipboard Image.png

1973年TCP/IP協議實際上就已經提出來了,在TCP的基礎之上已經有了FTP這樣的應用協議。那時挪威和英國的計算機其實已經能夠跟美國的計算機進行通信了,已經有互聯網的概念了。到了1982年,TCP/IP協議被標準化了,Internet的概念被正式提出來了。提出互聯網概念這兩個人,一個叫Vint Cerf,一個叫Robert Kahn,這兩個人也因此被譽爲這個互聯網之父。2004他們獲得了叫計算機界的諾貝爾獎叫圖靈獎,這是計算機界能夠獲得的最高的終生榮譽。Vint Cerf現在依然是Google的互聯網首席科學家。

隨後美國自然科學基金會建立了各個大學之間的高速傳播的網絡。如果把互聯網想成是一棵大樹,那當時美國各個大學之間建立的主幹網絡,就形成了最重要的幾個核心主枝幹。後面越來越多的子網或者其他的網絡,逐漸的連到這個主幹上,而形成我們今天整個全球化的互聯網。

Web的誕生

1990年的時候出現了World-Wide-Web,萬維網,就是現在簡稱的Web。大家注意一下這個詞,以及它在這張圖中的位置。在這個詞出現之前,在這張圖中都是冷冰冰的技術術語,很多術語非計算機專業的同學可能都沒有聽過。但是在這個World-Wide-Web出現之後,圖中的很多詞語都耳熟能詳了吧,比如Yahoo、Google和Facebook,這都是互聯網發展歷史上里程碑式的偉大企業。

在TCP/IP協議上傳輸信息的方式很早就出現了,比如FTP就是通過TCP/IP傳輸文件的方式。爲什麼萬維網會帶來這麼神奇的效應呢?因爲它第一次帶來了一種叫做超媒體(Hypermedia)的內容形態。超媒體可以在TCP/IP協議之上的傳輸,可以包含文字、音頻、視頻,同時可以相互鏈接,是一種全新的信息表達方式。

萬維網是由歐洲粒子研究中心的科學家博納斯.李發明的。他也是互聯網發展歷程中里程碑式的人物。他設計了這樣一套支撐萬維網的一整套體系。其實嚴格來說,中國商業上的互聯網報道,嚴格意義上指的其實都是Web,即萬維網。比如大家可能聽過這樣的故事,說馬雲在1995年的時候,在美國看到了互聯網,所以回國創辦了阿里巴巴,那個時候他們做的是中國黃頁。其實更準確地說,馬雲看到的是是萬維網。從技術上理解,中國黃頁就是將企業信息描述成爲超媒體(就是HTML文件),讓所有人都能訪問到。

Web最早只是一種靜態信息的發佈媒介,就是我們訪問到的網頁都是事先寫好的固定信息。在發展過程中,逐漸可以用來實現動態的功能。即通過瀏覽器不僅僅能夠看靜態的信息,還是使用動態的業務功能。1994年誕生的Amazon就是一個電子商務網站。Web不管在商業還是在技術上都發展極其迅速。以至於2001年甚至出現了.com泡沫,那個時候只要企業弄一個.com的網站就被認爲是一個高科技企業。一個.com網站,從技術上來看,就是萬維網這個超過規模的分佈式系統中的一個小節點。

所以萬維網的出現之後,真正的改變普通人生活的各類網絡應用纔開始不斷涌現。這張圖應該是2013年製作的,如果這兩年來畫這張圖,應該可以看到Uber和Airbnb這樣互聯網企業了。

Web的技術內涵

萬維網最早其實就是一幫科學家在玩,他們希望通過互聯網來傳送實驗數據。因此發明了描述信息、定位信息和傳輸信息的一整套技術體系。

萬維網從技術內涵上怎麼來理解呢?首先它是運行在互聯網上的,是一個TCP/IP協議之上的應用協議,它是一種超文本文檔相互鏈接形成的一種超大規模的分佈式系統。

這裏需要了解一下三個術語:HTTP超文本傳輸協議、HTML超文本語言和URL統一資源定位服務。雖然是技術術語,但是在我們每天的上網過程中都能看到它們的痕跡。

  • 今天你們經常聽到Html5,比如微信的HTML5頁面,HTML5遊戲等。HTML是從1.0版本開始的,有一個叫W3C的標準化組織,逐步在維護這樣一套HTML語言的標準,一直演化到今天的HTML5。HTML的作用是描述超文本文檔。比如說我們希望有一個東西展示給用戶,你需要用HTML表達出來,這樣才能放到萬維網上讓別人瀏覽。
  • URL可以理解爲網址,就是我們在瀏覽器中輸入的一個字符串。它用來定位超文本文檔,URL協議定義了Web上如何標識出一個網頁,即超文本文檔。這跟IP協議如何標識出一臺計算機的意義是相似的。
  • 我們在瀏覽器中輸入網址,會看到網址前面都有一個“http”,這指的就是一種HTTP協議。HTTP協議定義瞭如何與超文本交互,信息通過超文本文檔描述好了,也可以定位到了,接下來就需要通過HTTP協議去訪問。HTTP協議定義了一套與網頁交互的工作,我們不去細究,我們只需知道這是獲取信息的一種協議,瀏覽器會把我們的各種動作翻譯成HTTP協議相關動作與Web服務器進行交互,並且將得到的超文本文檔渲染成可讀的內容讓我們方便瀏覽。我們所謂的“連接”在技術層面都時這些協議在默默地發揮着基礎設施的作用。這就是萬維網的一個基本原理。

訪問一個網頁時發生了什麼?

基於對這三個協議的理解,我們來重新審覈在瀏覽器中訪問一個Web頁面的過程。

Clipboard Image.png

在移動端和PC端都可以訪問網頁,比如我們去訪問Google的頁面,google.com網址就是符合URL規範的網址。瀏覽器看到這個網址,首先去查詢DNS(Domain Naming Service)服務器,DNS服務器會將網址轉換爲IP地址。萬維網是運行在TCP/IP協議之上的,所以首先需要知道Web服務器的IP地址,DNS幫我們做了這件事情。

有了IP地址,瀏覽器就可以基於HTTP協議,向遠程的Web服務器發送請求了。而Google的Web服務器就能夠接收到這樣的請求,收到這樣的請求之後,它就會調用後端的一系列功能並且最終組裝出HTML頁面,通過HTTP協議返回給瀏覽器。瀏覽器把返回的HTML文本渲染成爲一個美觀而且可讀的頁面,這就是在瀏覽器中看到Google的頁面了。這整個過程是在TCP/IP協議之上完成的,Web請求和Web響應都會安裝TCP協議要求的方式進行打包和傳輸。

小節

所以總結一下,互聯網通過TCP/IP協議把計算機連接到了一起;而叫萬維網是運行在互聯網之上,基於HTML、URL和HTTP這三個協議進一步把計算機上的信息資源連接到一起。因爲從計算機的連接擴展到了信息的連接,互聯網這個基礎設施的深度和廣度得到了巨大的擴展。

其實無論是技術的發展和人類社會的發展,都可以找到這樣一種基礎設施不斷地層壘式發展的規律。我們剛剛說到微信這樣一個超級App都已經成爲新一代的基礎設施了,因爲它在信息連接的基礎之上更深入的把人把服務都連接進來了,人們可以利用微信的開放平臺更快地延展我們信息和服務到達的深度和廣度。我們同學們創新的一種可能就是在一個很小的垂直領域,基於既有技術基礎,同時技術或者模式創新去延展信息達到的範圍和擴大信息獲取的效率。

版權聲明

本文由David創作,轉載需署名作者且註明文章出處

https://www.tianmaying.com/tutorial/internet-and-web

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章