Linux服務端最大併發數是多少?

1. 開場白

在開始今天的文章之前,先拋一個面試題出來:

你接觸過的單機最大併發數是多少?
你認爲當前正常配置的服務器物理機最大併發數可以到多少?
說說你的理解和分析。

思考幾分鐘,如果你可以有理有據地說出答案,那確實就不用再往下看了,關上手機去陪陪家人是個不錯的選擇。

思考幾分鐘,如果你沒有頭緒或者對答案不確定,那麼你先不用着急關閉頁面去玩耍,你應該繼續往下看,因爲這個問題很不錯。

對於後端開發人員來說,併發數往往和技術難度是呈正相關的,實際上也確實如此:體量決定架構

服務端根據不同業務場景會有不同的側重點,單純追求高併發其實並不是根本目的,高可用&穩定性更重要

所以最終我們的目的是:保證高可用高穩定的基礎上追求高併發,降本增效

高可用&高併發是我們直觀感受到的,本質上這是個複雜的系統工程,每個環節都會影響結果,每一塊都值得研究和深入。


2. C10K問題和C10M問題

在2000年初的時候,全球互聯網的規模並不大,但是當時就已經提出了C10K問題,所謂C10K就是單機1w併發問題,雖然現在不覺得是個難題了,但是這在當初是很有遠見和挑戰的問題。

C10K問題最早由Dan Kegel發佈於其個人站點,原文鏈接如下:

http://www.kegel.com/c10k.html

相關資料顯示Dan Kegel目前工作於Google,從1978年起開始接觸計算機編程,是Winetricks和Crosstool的作者,大佬年輕時的照片:

Dan Kegel這篇文章閱讀難度並不大,大白建議從事服務端開發或者對高性能網絡開發有興趣的讀者嘗試讀一讀。

在APUE第三版都沒有提到epoll,所以我們解決C10K問題的時間並不長,其中IO複用epoll/kqueue/iocp等技術對於C10k問題的解決起到了非常重要的作用。

開源大神們基於epoll/kqueue等開發了諸如libevent/libuv等網絡庫,從而大幅提高了高併發網絡的開發效率,對於C/C++程序員來說並不陌生。

這裏簡單提一下針對下一個10年的展望和挑戰:C10M問題

站在浪尖的那一批人早就開始思考讓單機達到1000w併發,現在聽起來感覺不可思議,但是要達到這個目標,除了硬件上的提升,更重要的是對系統軟件和協議棧的改造

Errata Security的CEO Robert Graham在Shmoocon 2013大會上的演講,大佬重要的觀點是:

不要讓OS內核執行所有繁重的任務:將數據包處理、內存管理、處理器調度等任務從內核轉移到應用程序高效地完成,讓諸如Linux這樣的OS只處理控制層,數據層完全交給應用程序來處理。

確實也是如此,難道你不覺得Linux內核做了太多不該自己做的事情了嗎

近幾年出現的DPDK、PFRING、NETMAP等技術也是類似的思想,現在流行的協處理器+CPU的架構也是這樣的:


3. 服務器最大併發數分析

前面提到的C10K和C10M問題都是圍繞着提升服務器併發能力展開的,但是難免要問:服務器最大的併發上限是多少

3.1 五元組

做過通信的盆友們一定聽過五元組這個概念,一個五元組可以唯一標記一個網絡連接,所以要理解和分析最大併發數,就必須理解五元組:

這樣的話,就可以基本認爲:理論最大併發數 = 服務端唯一五元組數

3.2 端口&IP組合數

那麼對於服務器來說,服務端唯一五元組數最大是多少呢?

有人說是65535,顯然不是,但是之所以會有這類答案是因爲當前Linux的端口號是2字節大小的short類型,總計2^16個端口,除去一些系統佔用的端口,可用端口確實只剩下64000多了。

對於服務端本身來說,DestPort數量確實有限,假定有多張網卡,每個網卡綁定多個IP,服務端的Port端口數和IP數的組合類型也是有限的

對於客戶端來說,本身的端口和IP也是一樣有限的,雖然這是個組合問題,但是數量還是有限的:

3.3 併發數理論極限

看了前面的端口&IP的組合數計算,好像併發數並不會特別大。

錯了,是真的會很大。

分析一下,前面的計算都是針對單個服務器或者客戶端的,但是實際上每個服務器會應對全網的所有客戶端,那麼從服務端看,源IP和源Port的數量是非常大的。

理論上服務端可以接受的客戶端IP是2^32(按照IPv4計算),端口數是2^16,目前端口號仍然是16bit的,所有這個理論最大值是2^48,果然很大!

3.4 實際情況

天下沒有免費的午餐。

每一條連接都是要消耗系統資源的,所以實際中可能會設置最大併發數來保證服務器的安全和穩定,所以這個理論最大併發數是不可能達到的

實際中併發數和業務是直接相關的,像Redis這種內存型的服務端併發十幾萬都是沒問題的,大部分來講幾十/幾百/幾千/幾萬等是存在的。


4. 客戶端最大連接數

理解了服務器的最大併發數是2^48,那麼客戶端最多可以連接多少服務器呢

對於客戶端來說,當然可以藉助於多網卡多IP來增加連接能力,我們仍然假定客戶端只有1張網卡1個IP,由於端口數的限制到2^16,再去掉系統佔用的端口,剩下可用的差不多64000。

也就是說,客戶端雖然可以連接任意的目的IP和目的端口,但是客戶端自身端口是有限的,所以客戶端的理論最大連接數是2^16,含系統佔用端口。


5. NAT環境下的客戶端

解決前面的兩個問題之後,來看另外一個問題:

一個公網出口NAT服務設備最多可同時支持多少內網IP併發訪問外網服務?

畢竟公網IP都是有限並且要花錢的,我們大部分機器都是在局域網中結合NAT來進行外網訪問的,所以這個場景還是很熟悉的。

來看下內網機器訪問外網時的IP&端口替換和映射還原的過程,就明白了:

因爲這時的客戶端是NAT設備,所以NAT環境下最多支持65535個併發訪問外網。


6.小結

本文通過一道面試題切入,先描述了C10K和C10M問題,進而詳細說明了客戶端的最大訪問數和服務端的最大併發數計算和原理,最後描述了NAT場景下的訪問併發數。

雖然理論服務端併發數非常大,但是我們也沒有必要覺得併發數高就厲害,服務複雜程度不一樣,切忌唯併發數來判斷業務和開發者水平

試想echo服務和訂單交易服務顯然是不一樣的,我們應該做的是在服務穩定和高可用的前提下去從緩存/網絡/數據庫等多個角度來優化提高性能

有道無術,術可成;有術無道,止於術

歡迎大家關注Java之道公衆號

好文章,我在看❤️

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章