後端接入層技術的一些思考

前言

網上技術文章已經氾濫了，部分寫得非常好，看着看着，就覺得自己太菜，感覺也沒有下筆的必要了。但是，寫文章也是一個梳理自身思路的一個過程，用輸出倒逼輸入，一直都是挺不錯的學習方法，不然網上文章看完就不記得是馬什麼梅了，因此，還是決定寫寫自己對於這塊技術的一些思考。

接入層，沒找到具體的定義，按我的理解，就是位於防火牆之後，承接前端用戶請求（通過瀏覽器或者app等）的最前沿的服務器集羣，一般會和用戶正向代理軟件（瀏覽器、app之類）直接建立網絡連接，負責接收用戶請求，轉發到邏輯層服務處理，再將邏輯層響應返回給用戶。當然，這只是最初級的場景，因爲接入層實際是流量入口，所以它可以做很多流量調度的事情，舉個例子，大家如果去過都江堰，就會看到江的中間，有一段沙洲，這片沙洲就能將奔流的岷江水分流，分流後，水流就不至於在暴雨時節對下游造成洪澇災害。

“魚嘴”是都江堰的分水工程，因其形如魚嘴而得名，位於岷江江心，把岷江分成內外二江。西邊叫外江，俗稱“金馬河”，是岷江正流，主要用於排洪；東邊沿山腳的叫內江，是人工引水渠道，主要用於灌溉。

而且這也纔是第一道分水工程，我查了下都江堰的排沙工程，又被秀到了，竟然暗合了軟件架構中的限流熔斷思想，當初去都江堰還是應該找個導遊，現在覺得真是看了個寂寞。

飛沙堰的作用主要是當內江的水量超過寶瓶口流量上限時，多餘的水便從飛沙堰自行溢出；如遇特大洪水的非常情況，它還會自行潰堤，讓大量江水迴歸岷江正流。

什麼叫“水旱從人，不知饑饉”，這就是。

說回正題，接入層就是個流量口子，我們可以根據我們的想法，自由地分發流量給後端的服務集羣（負載均衡），當流量過大時，可以限流熔斷，同時，可以進行認證鑑權，打擊灰產，日誌記錄，監控上報，灰度發佈等各類功能。

接下來，會說一下典型的架構。

單idc架構（無長連接）

大部分中小型公司，如果就是提供一個網站對外訪問，也不需要接收後端通知的話（如實時IM通信），可能都會是這類架構，我任職過的公司裏，也有這類架構。下圖就以我熟悉的nginx來作爲接入層組件了，lvs也可以，個人研究不多，就先算了。

這個架構主要的問題在於，接入服務都在單個機房，一旦這個機房掛了或者這個vip出了問題，服務基本就不可用了。

同城多idc架構（無長連接）

解決的辦法，就是多機房容災，包括了同城多個機房（一個城市裏多個機房）、兩地多中心（兩個城市，多個機房）、三地多中心（三個城市，多個機房）；再根據機房是否多活（多個機房可以同時處理用戶請求，即每個機房都有流量），分爲了：同城多活、異地多活（異地多活就是異地的多個城市，如深圳、上海，都可以同時處理流量，這時候基本要上單元化架構了）

中小公司，我個人覺得，同城多活基本也就足夠了，基本就是下面這個樣子。

單idc架構（有長連接場景）

短連接：tcp建立連接，傳輸完數據後，馬上關閉連接。下次要傳數據時，再來一次三次握手--傳數據--四次揮手。

長連接：tcp建立連接，傳輸完數據後，不關閉連接，下次要傳數據時，找到前面沒關的長連接，直接傳數據，傳完也不關閉。

長連接一般適用於，後端需要主動通知用戶的場景，當然了，也不是說，這種時候就必須要用長連接，客戶端輪詢、長輪詢也是可以實現這種場景的，但這裏我們只說長連接這種實現方式。

這種方式的好處在於，非常實時，要的就是一個快，後端只要需要給我發消息，我馬上能收到。

對於這塊的架構，我個人目前傾向於如下設計：

即，用戶在準備進行長連接時，首要的事情就是，拿到要接入的長連接服務器的ip+端口，要拿到這個ip+端口，有很多方式，像我圖裏畫的，就是這樣一種模式：

client端，首先調用短連接網關，短連接網關可能首先對用戶鑑權，提示登陸等；登陸成功後，client端調用短連接網關，請求獲取長連接服務器的"ip+端口"列表。當然，這裏爲了簡單，你可以直接寫死成一個配置，但是，我們建議靈活一點，提取一個單獨的服務（如上圖的長連接server manager），對外提供對應的獲取長連接服務器列表的接口。
client端，拿到長連接服務器列表後，接下來要做的就是選擇其中的一個。這塊就可以有很多策略了，比如，可以ping一下每個ip，看看延遲，可以選擇延遲最低的；或者是根據業務邏輯，自己實現一個策略。
client拿到想要連接的ip+端口後，進行tcp 連接即可；對應的長連接服務器，收到client連接請求後，就會在內存或者redis之類的，維護一個map，key：用戶id/終端id，value：長連接對象。同時，可以上報一些統計數據給長連接server manager，如當前服務器1.1.1.1維護了2000個用戶的長連接，屆時，長連接server manager就可以根據這些統計數據，來提示client可以連接某個負載比較小的服務器（這塊的策略也可以自由實現，比如幫client端推薦一個長連接服務器、強制客戶端使用某臺服務器等）

這裏還有一點，客戶端現在是通過調用如上方式，獲取長連接服務器；但要是這個鏈路有問題呢，這時候可以有對應的降級機制，比如使用dns域名方式來獲取，或者是使用客戶端中寫死的一批ip。

服務端如何主動做推送呢？這裏不打算展開了，比如要給用戶xxx發消息，那此時，有兩種方式，一種是，想辦法查詢到，xxx在哪臺接入服務器上；另一種是，給每臺接入服務器發請求，類似於廣播，接入服務器收到這種廣播請求後，檢查對應的用戶歸不歸自己管，不歸的話，就不管。

多idc架構（有長連接場景）

這個架構還有啥問題嗎？大家可以看到，圖裏是位於深圳機房的，服務於廣東用戶，估計延遲還好，要是服務北京用戶，北京用戶通過長連接，連到深圳，深圳這邊推送消息時，走公網推送給用戶，這個延遲肯定低不了。有啥好辦法嗎，我覺得，可以採用多機房，就近接入的方式。

比如，深圳、上海各一個機房，北京用戶接入上海機房，物理上就近多了，自然要快一些。這個場景下，流程是如何的呢？

用戶通過dns（配置多條A記錄，指向上海、深圳機房的短連接網關地址），理論上，可以獲取到就近的機房的地址；如廣東用戶應該會取到深圳機房地址，北京用戶會取到上海機房的地址。如果不行的話，我們還有其他辦法，如gslb，後面講。
此時，假設沒有部署異地多活，上海機房只負責了接入層，沒部署業務層的服務和db等；此時，深圳側的業務服務發起消息推送，推給北京某個用戶，此時是可以通過長連接Server Manager，查到用戶在上海接入；那就把這個推送請求，發給上海這邊的接入服務器。因爲大公司的機房之間，路線一般是有專網，或者是花了不少錢的，速度肯定比公網要快一些。比如，騰訊的深圳上海機房的延遲，基本就是幾十ms。

這邊有一個點是，深圳、上海的長連接Server Manager進行了雙向同步。不雙向同步，感覺也是可以的，我們可以根據用戶的登陸ip，查詢ip屬於哪個省，如果是北京，則認爲該用戶在上海機房接入了，則交給上海機房去推送即可。

gslb技術

我們上面提到，深圳、上海各一個機房，此時，dns要配兩條A記錄地址，指向各機房。同時，我們假設了，dns解析商那邊，會把北京用戶解析到上海機房。

但這個假設，不一定生效，dns解析商那邊的解析還是比較粗糙的，如果我們希望把這塊掌握在自己手裏，那就可以使用gslb技術（global server load balance）。

有一種簡單的實現方式，簡單來說，就是dns解析那裏，配置兩條ns記錄，ns記錄分別指向深圳、上海機房的自研的dns服務器。自研的dns服務器，就可以用我們自定義的規則，來決定這次dns解析，給用戶返回什麼地址。自研dns，可以這樣做，比如查詢用戶屬於電信還是網通，屬於哪個省，來決定返回深圳、還是上海的機房地址。

後端接入層技術的一些思考

後端接入層技術的一些思考

前言

單idc架構（無長連接）

同城多idc架構（無長連接）

單idc架構（有長連接場景）

多idc架構（有長連接場景）

gslb技術

致遠OA及相關OA系統集成與二次開發

System.Object未被引用的程序集中定義

Java 信號量（semaphore）搭配CountDownLatch 實現多線程處理循環內邏輯並限制創建線程數

【面試準備】項目經驗——接口自動化項目

ssh登錄太慢了，每次都要20s

es從線上庫導出數據並導入開發環境

Feign源碼解析7：nacos loadbalancer不支持靜態ip的負載均衡

Feign源碼解析6：如何集成discoveryClient獲取服務列表

Feign源碼解析5：loadbalancer

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結