在許多的高端開發的崗位中都會或多或少有要求面試人員要研究過一些常用中間件源碼。這是因爲一切的祕密都是藏在源碼中,閱讀源碼能夠讓我們對框架或者中間件的理解更加深刻,而我們也能夠在源碼的研究中獲得其中一些優秀的設計方式。而我們的中間件和源碼那麼多,我們該從何入手呢?其實大部分的中間件或者框架都有一些共性的部分,例如網絡編程、多線程、反射和類加載等技術。所以深入研究透了一兩個中間件的話,那麼再回過頭來看其它的中間件,那麼就會很容易理解它裏面所用的技術以及原理。而作爲一個老牌的WEB端框架Tomcat,無論是其整體的架構設計,還是其內在的一些技術靈活應用,都值得我們一看。
在學習框架的時候,我一般都是對這個框架有一個整體的認識。知道它整體是如何運行的,然後再深入其中某部分進行研究,這樣會事半功倍。
整體架構
我們想要了解一個框架,首先要了解它是幹什麼的,Tomcat我們都知道,是用於處理連接過來的Socket請求的。那麼Tomcat就會有兩個功能:
- 對外處理連接,將收到的字節流轉化爲自己想要的Request和Response對象
- 對內處理Servlet,將對應的Request請求分發到相應的Servlet中
那麼我們整體的骨架就出來了,Tomcat其實就分爲兩大部分,一部分是連接器(Connnector)處理對外連接和容器(Container)管理對內的Servelet。大體的關係圖如下
最外層的大框就是代表一個Tomcat服務,一個Tomcat服務可以對應多個Service。每個Service都有連接器和容器。這些對應的關係我們也可以打開在Tomcat目錄配置文件中server.xml
中看出來。
<Server port="8006" shutdown="SHUTDOWN">
<Service name="Catalina">
<Connector port="8080" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443" />
<Connector port="8010" protocol="AJP/1.3" redirectPort="8443" />
<Engine name="Catalina" defaultHost="localhost">
<Realm className="org.apache.catalina.realm.LockOutRealm">
<Realm className="org.apache.catalina.realm.UserDatabaseRealm"
resourceName="UserDatabase"/>
</Realm>
<Host name="localhost" appBase="webapps"
</Host>
</Engine>
</Service>
</Server>
這裏我將其中配置文件中刪除了一些內容精簡了一下,這裏我們可以看到連接器其實就是Connector
,一個Service中可以有多個連接器,容器其實對應的就是Engine
。
Tomcat的整體架構簡單來說就是這樣的對應關係。接下來我們簡單的介紹連接器的整體架構和容器的整體架構。
連接器
我們可以看到上圖中連接器傳給容器的是ServletRequest
對象,而容器傳給連接器的是ServletResponse
對象,這些在網絡傳輸過程中是肯定不行的,因爲網絡傳輸中傳送的字節流。所以連接器的功能需求我們大概能總結出來以下幾點。
- Socket連接
- 讀取請求網絡中的字節流
- 根據相應的協議(Http/AJP)解析字節流,生成統一的
Tomcat Request
t對象 - 將
Tomcat Reques
傳給容器 - 容器返回
Tomcat Response
對象 - 將
Tomcat Response
對象轉換爲字節流 - 將字節流返回給客戶端
其實上面的細分都能總結爲以下的三點
- 網絡通信
- 應用層協議的解析
- Tomcat的
Request/Response
與ServletRequest/ServletResponse
對象的轉化
而在Tomcat中它也用了三個類來實現上面的三個功能,分別對應如下
- EndPoint
- Processor
- Adapter
用圖表示他們的關係的話就是這樣
容器
容器,顧名思義就是裝東西的器具,那麼這個Tomcat容器是裝什麼的呢?其實主要的就是裝了Servlet的。那麼容器是如何設計的呢?Tomcat的容器設計其實是用了組合設計模式。其實從Server.xml
中我們也能看到其關係了。
<Engine name="Catalina" defaultHost="localhost">
<Host name="localhost" appBase="webapps"
unpackWARs="true" autoDeploy="true">
</Host>
</Engine>
在這裏面我們只能看到容器中的兩個模塊,一個是頂層模塊Engine
,另一個是Host
,其實還有兩個模塊,一個是Context
對應的是我們webapp裏面的每個應用文件夾,每個文件夾就是對應一個Context
,還有一個模塊Wrapper
對應的是我們Context
中的所有servlet,Wrapper
管理了訪問關係與具體的Servlet的對應。圖表示就是下面這樣。
Tomcat中容器所有模塊都實現了Container
接口,而組合模式的意義就是使得用戶對於單個對象和組合對象的使用具有一致性,即無論添加多少個Context
其使用就是爲了找到其下面的Servlet,而無論添加多少個Host也是爲了找個下面的Servlet。而在容器中設計了這麼多的模塊,一個請求過來Tomcat如何找到對應的Servlet進行處理呢?
請求如何定位
我們就舉個最簡單的例子,我們本機應用上啓動了一個Tomcat,webapp下有我們部署的一個應用buxuewushu
。我們在瀏覽器上輸入http://localhost:8080/buxuewushu/add.do
是如何找到對應Servlet進行處理呢?
在我們啓動Tomcat的時候,連接器就會進行初始化監聽所配置的端口號,這裏我們配置的是8080端口對應的協議是HTTP。
- 請求發送到本機的8080端口,被在那裏監聽的HTTP/1.1的連接器Connector獲得
- 連接器Connector將字節流轉換爲容器所需要的
ServletRequest
對象給同級Service
下的容器模塊Engine進行處理 - Engine獲得地址
http://localhost:8080/buxuewushu/add
。匹配他下面的Host主機 - 匹配到名爲localhost的Host(就算此時請求爲具體的ip,沒有配置相應的Host,也會交給名爲localhost的Host進行處理,因爲他是默認的主機)
- Host匹配到路徑爲
/buxuewushu
的Context,即在webapp下面找到相應的文件夾 - Context匹配到URL規則爲*.do的servlet,對應爲某個Servlet類
- 調用其
doGet
或者doPost
方法 - Servlet執行完以後將對象返回給Context
- Context返回給Host
- Host返回給Engine
- Engine返回給連接器Connector
- 連接器Connector將對象解析爲字節流發送給客戶端