Tomcat組成與工作原理

Tomcat是什麼

開源的Java Web應用服務器，實現了Java EE(Java Platform Enterprise Edition)的部分技術規範，比如 Java Servlet、Java Server Page、JSTL、Java WebSocket。Java EE 是 Sun公司爲企業級應用推出的標準平臺，定義了一系列用於企業級開發的技術規範，除了上述的之外，還有 EJB、Java Mail、JPA、JTA、JMS 等，而這些都依賴具體容器的實現。

上圖對比了 Java EE 容器的實現情況，Tomcat 和 Jetty 都只提供了 Java Web 容器必需的 Servlet 和 JSP 規範，開發者要想實現其他的功能，需要自己依賴其他開源實現。

Glassfish 是由 sun 公司推出，Java EE 最新規範出來之後，首先會在 Glassfish 上進行實現，所以是研究 Java EE 最新技術的首選。

最常見的情況是使用 Tomcat 作爲 Java Web 服務器，使用 Spring 提供的開箱即用的強大的功能，並依賴其他開源庫來完成負責的業務功能實現。

Servlet容器

Tomcat 組成如下圖：
主要有 Container 和 Connector 以及相關組件構成。

Server：指的就是整個 Tomcat 服務器，包含多組服務，負責管理和啓動各個 Service，同時監聽 8005 端口發過來的 shutdown 命令，用於關閉整個容器；

Service：Tomcat 封裝的、對外提供完整的、基於組件的 web 服務，包含 Connectors、Container 兩個核心組件，以及多個功能組件，各個 Service 之間是獨立的，但是共享同一 JVM 的資源；

Connector：Tomcat 與外部世界的連接器，監聽固定端口接收外部請求，傳遞給 Container，並將 Container 處理的結果返回給外部；

Container：Catalina，Servlet 容器，內部有多層容器組成，用於管理 Servlet 生命週期，調用 servlet 相關方法。

Loader：封裝了 Java ClassLoader，用於 Container 加載類文件；

Realm：Tomcat 中爲 web 應用程序提供訪問認證和角色管理的機制；

JMX：Java SE 中定義技術規範，是一個爲應用程序、設備、系統等植入管理功能的框架，通過 JMX 可以遠程監控 Tomcat 的運行狀態；

Jasper：Tomcat 的 Jsp 解析引擎，用於將 Jsp 轉換成 Java 文件，並編譯成 class 文件。

Session：負責管理和創建 session，以及 Session 的持久化(可自定義)，支持 session 的集羣。

Pipeline：在容器中充當管道的作用，管道中可以設置各種 valve(閥門)，請求和響應在經由管道中各個閥門處理，提供了一種靈活可配置的處理請求和響應的機制。

Naming：命名服務，JNDI， Java 命名和目錄接口，是一組在 Java 應用中訪問命名和目錄服務的 API。命名服務將名稱和對象聯繫起來，使得我們可以用名稱訪問對象，目錄服務也是一種命名服務，對象不但有名稱，還有屬性。Tomcat 中可以使用 JNDI 定義數據源、配置信息，用於開發與部署的分離。

Container組成

Engine：Servlet 的頂層容器，包含一個或多個 Host 子容器；
Host：虛擬主機，負責 web 應用的部署和 Context 的創建；
Context：Web 應用上下文，包含多個 Wrapper，負責 web 配置的解析、管理所有的 Web 資源；
Wrapper：最底層的容器，是對 Servlet 的封裝，負責 Servlet 實例的創建、執行和銷燬。

生命週期管理
Tomcat 爲了方便管理組件和容器的生命週期，定義了從創建、啓動、到停止、銷燬共 12 中狀態，tomcat 生命週期管理了內部狀態變化的規則控制，組件和容器只需實現相應的生命週期方法即可完成各生命週期內的操作(initInternal、startInternal、stopInternal、 destroyInternal)；

比如執行初始化操作時，會判斷當前狀態是否 New，如果不是則拋出生命週期異常；是的話則設置當前狀態爲 Initializing，並執行 initInternal 方法，由子類實現，方法執行成功則設置當前狀態爲 Initialized，執行失敗則設置爲 Failed 狀態；

Tomcat 的生命週期管理引入了事件機制，在組件或容器的生命週期狀態發生變化時會通知事件監聽器，監聽器通過判斷事件的類型來進行相應的操作。
事件監聽器的添加可以在 server.xml 文件中進行配置;

Tomcat 各類容器的配置過程就是通過添加 listener 的方式來進行的，從而達到配置邏輯與容器的解耦。如 EngineConfig、HostConfig、ContextConfig。
EngineConfig：主要打印啓動和停止日誌
HostConfig：主要處理部署應用，解析應用 META-INF/context.xml 並創建應用的 Context

ContextConfig：主要解析併合並 web.xml，掃描應用的各類 web 資源 (filter、servlet、listener)

Tomcat 的啓動過程

啓動從 Tomcat 提供的 start.sh 腳本開始，shell 腳本會調用 Bootstrap 的 main 方法，實際調用了 Catalina 相應的 load、start 方法。

load 方法會通過 Digester 進行 config/server.xml 的解析，在解析的過程中會根據 xml 中的關係和配置信息來創建容器，並設置相關的屬性。接着 Catalina 會調用 StandardServer 的 init 和 start 方法進行容器的初始化和啓動。

按照 xml 的配置關係，server 的子元素是 service，service 的子元素是頂層容器 Engine，每層容器有持有自己的子容器，而這些元素都實現了生命週期管理的各個方法，因此就很容易的完成整個容器的啓動、關閉等生命週期的管理。

StandardServer 完成 init 和 start 方法調用後，會一直監聽來自 8005 端口(可配置)，如果接收到 shutdown 命令，則會退出循環監聽，執行後續的 stop 和 destroy 方法，完成 Tomcat 容器的關閉。同時也會調用 JVM 的 Runtime.getRuntime()﴿.addShutdownHook 方法，在虛擬機意外退出的時候來關閉容器。

所有容器都是繼承自 ContainerBase，基類中封裝了容器中的重複工作，負責啓動容器相關的組件 Loader、Logger、Manager、Cluster、Pipeline，啓動子容器(線程池併發啓動子容器，通過線程池 submit 多個線程，調用後返回 Future 對象，線程內部啓動子容器，接着調用 Future 對象的 get 方法來等待執行結果)。

List<Future<Void>> results = new ArrayList<Future<Void>>();
for (int i = 0; i < children.length; i++) {
    results.add(startStopExecutor.submit(new StartChild(children[i])));
}
boolean fail = false;
for (Future<Void> result ： results) {
    try {
        result.get();
    } catch (Exception e) {
        log.error(sm.getString("containerBase.threadedStartFailed")， e);
        fail = true;
    }
}

Web 應用的部署方式
注：catalina.home：安裝目錄;catalina.base：工作目錄;默認值 user.dir

Server.xml 配置 Host 元素，指定 appBase 屬性，默認$catalina.base/webapps/
Server.xml 配置 Context 元素，指定 docBase，元素，指定 web 應用的路徑
自定義配置：在$catalina.base/EngineName/HostName/XXX.xml 配置 Context 元素

HostConfig 監聽了 StandardHost 容器的事件，在 start 方法中解析上述配置文件：

掃描 appbase 路徑下的所有文件夾和 war 包，解析各個應用的 META-INF/context.xml，並創建 StandardContext，並將 Context 加入到 Host 的子容器中。
解析$catalina.base/EngineName/HostName/下的所有 Context 配置，找到相應 web 應用的位置，解析各個應用的 META-INF/context.xml，並創建 StandardContext，並將 Context 加入到 Host 的子容器中。

注：

HostConfig 並沒有實際解析 Context.xml，而是在 ContextConfig 中進行的。
HostConfig 中會定期檢查 watched 資源文件(context.xml 配置文件)

ContextConfig 解析 context.xml 順序：

先解析全局的配置 config/context.xml
然後解析 Host 的默認配置 EngineName/HostName/context.xml.default
最後解析應用的 META-INF/context.xml

ContextConfig 解析 web.xml 順序：

先解析全局的配置 config/web.xml
然後解析 Host 的默認配置 EngineName/HostName/web.xml.default 接着解析應用的 MEB-INF/web.xml
掃描應用 WEB-INF/lib/下的 jar 文件，解析其中的 META-INF/web-fragment.xml 最後合併 xml 封裝成 WebXml，並設置 Context

注：

掃描 web 應用和 jar 中的註解(Filter、Listener、Servlet)就是上述步驟中進行的。
容器的定期執行：backgroundProcess，由 ContainerBase 來實現的，並且只有在頂層容器中才會開啓線程。(backgroundProcessorDelay=10 標誌位來控制)

Servlet 生命週期

Servlet 是用 Java 編寫的服務器端程序。其主要功能在於交互式地瀏覽和修改數據，生成動態 Web 內容。

請求到達 server 端，server 根據 url 映射到相應的 Servlet
判斷 Servlet 實例是否存在，不存在則加載和實例化 Servlet 並調用 init 方法
Server 分別創建 Request 和 Response 對象，調用 Servlet 實例的 service 方法(service 方法內部會根據 http 請求方法類型調用相應的 doXXX 方法)
doXXX 方法內爲業務邏輯實現，從 Request 對象獲取請求參數，處理完畢之後將結果通過 response 對象返回給調用方
當 Server 不再需要 Servlet 時(一般當 Server 關閉時)，Server 調用 Servlet 的 destroy() 方法。

load on startup

當值爲 0 或者大於 0 時，表示容器在應用啓動時就加載這個 servlet; 當是一個負數時或者沒有指定時，則指示容器在該 servlet 被選擇時才加載; 正數的值越小，啓動該 servlet 的優先級越高;

single thread model

每次訪問 servlet，新建 servlet 實體對象，但並不能保證線程安全，同時 tomcat 會限制 servlet 的實例數目
最佳實踐：不要使用該模型，servlet 中不要有全局變量

請求處理過程 �

根據 server.xml 配置的指定的 connector 以及端口監聽 http、或者 ajp 請求
請求到來時建立連接,解析請求參數,創建 Request 和 Response 對象,調用頂層容器 pipeline 的 invoke 方法
容器之間層層調用,最終調用業務 servlet 的 service 方法
Connector 將 response 流中的數據寫到 socket 中

Pipeline 與 Valve �

Pipeline 可以理解爲現實中的管道,Valve 爲管道中的閥門,Request 和 Response 對象在管道中經過各個閥門的處理和控制。

每個容器的管道中都有一個必不可少的 basic valve,其他的都是可選的,basic valve 在管道中最後調用,同時負責調用子容器的第一個 valve。

Valve 中主要的三個方法:setNext、getNext、invoke;valve 之間的關係是單向鏈式結構,本身 invoke 方法中會調用下一個 valve 的 invoke 方法。

各層容器對應的 basic valve 分別是 StandardEngineValve、StandardHostValve、 StandardContextValve、StandardWrapperValve。

JSP引擎

JSP 生命週期

編譯階段:servlet 容器編譯 servlet 源文件,生成 servlet 類
初始化階段:加載與 JSP 對應的 servlet 類, 創建其實例,並調用它的初始化方法
執行階段:調用與 JSP 對應的 servlet 實例的服務方法
銷燬階段:調用與 JSP 對應的 servlet 實例的銷燬方法,然後銷燬 servlet 實例

JSP元素
代碼片段： <% 代碼片段 %>
JSP聲明： <%! declaration; [ declaration; ]+ ... %>
JSP表達式：<%= 表達式 %>
JSP註釋： <%-- 註釋 --%>
JSP指令： <%@ directive attribute=“value” %>
JSP行爲： <jsp:action_name attribute="“value”">HTML元素： html/head/body/div/p/…
JSP隱式對象：request、response、out、session、application、config、
pageContext、page、Exception</jsp:action_name>

JSP 元素說明
代碼片段:包含任意量的 Java 語句、變量、方法或表達式;
JSP 聲明:一個聲明語句可以聲明一個或多個變量、方法,供後面的 Java 代碼使用;
JSP 表達式:輸出 Java 表達式的值,String 形式;
JSP 註釋:爲代碼作註釋以及將某段代碼註釋掉
JSP 指令:用來設置與整個 JSP 頁面相關的屬性,
<%@ page ... %>定義頁面的依賴屬性,比如 language、contentType、errorPage、 isErrorPage、import、isThreadSafe、session 等等
<%@ include ... %>包含其他的 JSP 文件、HTML 文件或文本文件,是該 JSP 文件的一部分,會被同時編譯執行
<%@ taglib ... %>引入標籤庫的定義,可以是自定義標籤
JSP 行爲:jsp:include、jsp:useBean、jsp:setProperty、jsp:getProperty、jsp:forward

Jsp 解析過程 �

代碼片段:在_jspService()方法內直接輸出
JSP 聲明: 在 servlet 類中進行輸出
JSP 表達式:在_jspService()方法內直接輸出
JSP 註釋:直接忽略,不輸出
JSP 指令:根據不同指令進行區分,include:對引入的文件進行解析;page 相關的屬性會做爲 JSP 的屬性,影響的是解析和請求處理時的行爲
JSP 行爲:不同的行爲有不同的處理方式,jsp:useBean 爲例,會從 pageContext 根據 scope 的類別獲取 bean 對象,如果沒有會創建 bean,同時存到相應 scope 的 pageContext 中
HTML:在_jspService()方法內直接輸出
JSP 隱式對象:在_jspService()方法會進行聲明,只能在方法中使用;

Connector

Http:HTTP 是超文本傳輸協議,是客戶端瀏覽器或其他程序與 Web 服務器之間的應用層通信協議
AJP:Apache JServ 協議(AJP)是一種二進制協議,專門代理從 Web 服務器到位於後端的應用程序服務器的入站請求
阻塞 IO

非阻塞 IO

IO多路複用

阻塞與非阻塞的區別在於進行讀操作和寫操作的系統調用時，如果此時內核態沒有數據可讀或者沒有緩衝空間可寫時，是否阻塞。

IO多路複用的好處在於可同時監聽多個socket的可讀和可寫事件，這樣就能使得應用可以同時監聽多個socket，釋放了應用線程資源。

Tomcat各類Connector對比

Connector的實現模式有三種，分別是BIO、NIO、APR，可以在server.xml中指定。

JIO：用java.io編寫的TCP模塊，阻塞IO
NIO：用java.nio編寫的TCP模塊，非阻塞IO，（IO多路複用）
APR：全稱Apache Portable Runtime，使用JNI的方式來進行讀取文件以及進行網絡傳輸

Apache Portable Runtime是一個高度可移植的庫，它是Apache HTTP Server 2.x的核心。 APR具有許多用途，包括訪問高級IO功能（如sendfile，epoll和OpenSSL），操作系統級功能（隨機數生成，系統狀態等）和本地進程處理（共享內存，NT管道和Unix套接字）。

表格中字段含義說明：

Support Polling：是否支持基於IO多路複用的socket事件輪詢
Polling Size：輪詢的最大連接數
Wait for next Request：在等待下一個請求時，處理線程是否釋放，BIO是沒有釋放的，所以在keep-alive=true的情況下處理的併發連接數有限
Read Request Headers：由於request header數據較少，可以由容器提前解析完畢，不需要阻塞
Read Request Body：讀取request body的數據是應用業務邏輯的事情，同時Servlet的限制，是需要阻塞讀取的
Write Response：跟讀取request body的邏輯類似，同樣需要阻塞寫

NIO處理相關類

Acceptor線程負責接收連接，調用accept方法阻塞接收建立的連接，並對socket進行封裝成PollerEvent，指定註冊的事件爲op_read，並放入到EventQueue隊列中，PollerEvent的run方法邏輯的是將Selector註冊到socket的指定事件；

Poller線程從EventQueue獲取PollerEvent，並執行PollerEvent的run方法，調用Selector的select方法，如果有可讀的Socket則創建Http11NioProcessor，放入到線程池中執行；

CoyoteAdapter是Connector到Container的適配器，Http11NioProcessor調用其提供的service方法，內部創建Request和Response對象，並調用最頂層容器的Pipeline中的第一個Valve的invoke方法

Mapper主要處理http url 到servlet的映射規則的解析，對外提供map方法

NIO Connector主要參數

Comet

Comet是一種用於web的推送技術，能使服務器實時地將更新的信息傳送到客戶端，而無須客戶端發出請求
在WebSocket出來之前，如果不適用comet，只能通過瀏覽器端輪詢Server來模擬實現服務器端推送。
Comet支持servlet異步處理IO，當連接上數據可讀時觸發事件，並異步寫數據(阻塞)

Tomcat要實現Comet，只需繼承HttpServlet同時，實現CometProcessor接口

Begin：新的請求連接接入調用，可進行與Request和Response相關的對象初始化操作，並保存response對象，用於後續寫入數據
Read：請求連接有數據可讀時調用
End：當數據可用時，如果讀取到文件結束或者response被關閉時則被調用
Error：在連接上發生異常時調用，數據讀取異常、連接斷開、處理異常、socket超時

Note：

Read：在post請求有數據，但在begin事件中沒有處理，則會調用read，如果read沒有讀取數據，在會觸發Error回調，關閉socket
End：當socket超時，並且response被關閉時也會調用；server被關閉時調用
Error：除了socket超時不會關閉socket，其他都會關閉socket
End和Error時間觸發時應關閉當前comet會話，即調用CometEvent的close方法
Note：在事件觸發時要做好線程安全的操作

異步Servlet

傳統流程：

首先，Servlet 接收到請求之後，request數據解析；
接着，調用業務接口的某些方法，以完成業務處理；
最後，根據處理的結果提交響應，Servlet 線程結束

異步處理流程：

客戶端發送一個請求
Servlet容器分配一個線程來處理容器中的一個servlet
servlet調用request.startAsync()，保存AsyncContext, 然後返回
任何方式存在的容器線程都將退出，但是response仍然保持開放
業務線程使用保存的AsyncContext來完成響應（線程池）
客戶端收到響應

Servlet 線程將請求轉交給一個異步線程來執行業務處理，線程本身返回至容器，此時 Servlet 還沒有生成響應數據，異步線程處理完業務以後，可以直接生成響應數據（異步線程擁有 ServletRequest 和 ServletResponse 對象的引用）

爲什麼web應用中支持異步？

推出異步，主要是針對那些比較耗時的請求：比如一次緩慢的數據庫查詢，一次外部REST API調用, 或者是其他一些I/O密集型操作。這種耗時的請求會很快的耗光Servlet容器的線程池，繼而影響可擴展性。

Note：從客戶端的角度來看，request仍然像任何其他的HTTP的request-response交互一樣，只是耗費了更長的時間而已

異步事件監聽

onStartAsync：Request調用startAsync方法時觸發
onComplete：syncContext調用complete方法時觸發
onError：處理請求的過程出現異常時觸發
onTimeout：socket超時觸發

Note :
onError/ onTimeout觸發後，會緊接着回調onComplete
onComplete 執行後，就不可再操作request和response

三方三方

發佈了49 篇原創文章 · 獲贊 35 · 訪問量 2萬+

私信關注

Tomcat組成與工作原理

Tomcat是什麼

Servlet容器

JSP引擎

Connector

Comet

異步Servlet

Virtualbox配置centos7網絡

String對象不可變剖析

筆試題（持續更新）

MySql性能優化之參數優化

使用Spring Data JPA進行分頁與排序

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結