我的網絡模塊設計第二版

 

07年我寫了一篇文章叫《我的網絡模塊設計》,姑且叫那個爲第一版吧,由於持續對網絡模塊進行改進,所以現在的實現和當時有很大改變,加上上層應用越來越多,又經過了幾年時間考驗,現在的實現方式比之前的更靈活更有效率,也因爲最近看了一些人做網絡程序多年竟毫無建樹,一直要用別人寫的網絡模塊,所以有感而寫此文,爲了使得此文不受上一篇《我的網絡模塊設計》的影響,我決定寫之前不看原來的文章,所以此文跟原文那篇文章可能沒有太多相似性。

一個基本的網絡模塊,無非就是管理N個連接,快速處理每個連接的收發數據、消息等,所謂好的網路模塊,無非就是穩定、高效、靈活,下面分幾部分來寫:

一、               連接管理

之所以首先寫連接管理,是因爲連接管理是核心,也是最難的地方,我寫第一個網絡庫之前,搜索過很多當時可以找到的例子工程,當時幾乎找不到可穩定運行的工程,當然更找不到好的,於是摸索前進,期間對連接管理使用了各種方法,從最早一個cs(臨界區CriticalSection,我簡稱cs),recv send都用這個cs,到後來send用一個csrecv用一個cs,用多個的時候還出過錯,最後使用一個cs+一個原子值ref管理一個連接,每個連接send的時候用csrecv的時候用ref,如果該連接的消息要跨線程異步執行,也使用ref,如此較簡單的解決了連接管理的問題。

同樣使用生存期管理方法,也有人用智能指針,雖然原理和我直接操縱生存期一樣,但實現方法畢竟不同,不過我爲了讓實現依賴少一些沒有引入智能指針。

當然我後來也發現很多人不是用這種方法,如有些人就id來管理連接,每個連接分個id,其他操作全部用id,每次對連接的調用先翻譯一下,如果id找得到映射目標就調用,否則就說明該連接不存在了,這種方法簡單只是不直接,多了個查找過程,另外查找的時候可能還需要全局鎖(這依賴於連接數據組織)。

也有人使用一個線程管理連接,其他所有與該連接有關的生存期問題全部到該線程處理,這樣也是可行的,只是需要做一個較好的包裝,如果包裝好上層調用方便,如果包裝不好,可能上層調用就有一些約束。

雖然各種方法都有人使用,但我一直選擇直接的生存期管理方法,其實內部實現的時候還是有很多優化措施的,減少了大量addrefrelease的調用,進一步提高了效率。

二、               線程組

我最初做網絡庫的時候還不是很清楚上層如何使用這個庫,後來在上面做了幾個應用之後慢慢有了更多想法,最近的網絡庫是設計了這麼幾組線程:io線程組、同步線程組、異步線程組、時鐘線程組、log線程組,每組線程都可開可關,就算io線程組也是可關的,這只是爲了整個庫更靈活適用性更廣泛,如只用同步線程組或異步線程組僅將這個線程組當一個消息隊列使用。

Io線程組就是處理io收發的,listen recv send 以及解密解壓縮都是在這組線程,一般這組線程會開2個或2*cpu個。

同步線程組,一般這組線程開1個,用來處理logic

異步線程組,這組線程根據需要開0個或n個,簡單應用無db等慢速操作的應用不開,有很多db等慢速操作的可以開很多個。

時鐘線程組,一般不開或開1個。

Log線程組,一般開1個,主要爲了避免其他線程調用WriteLog的時候被磁盤io阻塞,所以弄了一個log線程。

其實還有一個主線程,我的每組線程(包括主線程)都支持事件和定時器,io線程、同步線程、異步線程組、時鐘線程組、甚至log線程組都支持事件和定時器,到去年我還只是讓每組線程都支持事件,今年爲了更好的使用時鐘我給每組線程設計了定時器,現在定時器線程組有點雞肋的味道,一般是用不上專門的定時器線程組,不過我還沒有將它刪掉,主要在我的設計裏面,它和同步異步線程組一樣,都只是一組線程,如果必要的時候可以將它用作同步線程或者異步線程組,所以繼續保留了它的存在。

這幾組線程之間都是可互發消息的,所以一個邏輯要異步到別的線程執行是非常方便的,只要調用一下PostXXEvent(TlsInfo *ptls, DWORD dwEvent, WPARAM wParam, LPARAM lParam);我憑藉這個設計使得這套網絡庫幾乎可以適用上層各種應用,不管是非常簡單的網絡應用還是複雜的,一框打盡。對最簡單的,一個io線程搞定,其他線程全關,對於複雜的io線程+同步+異步+log全開。

三、               內存池

內存池其實沒有想象中的那麼神祕,當然如果要讓一個網絡程序持續7*24小時穩定高效運行,內存池幾乎必不可少的,內存池的作用首先是減少內存碎片,其次是爲了提高速度,我想這兩點很容易想明白的,關於內存池我之前寫了系列文章,可參考我的博客:

 

《內存池之引言》 http://blog.csdn.net/oldworm/archive/2010/02/04/5288985.aspx

《單線程內存池》 http://blog.csdn.net/oldworm/archive/2010/02/04/5289003.aspx

《多線程內存池》 http://blog.csdn.net/oldworm/archive/2010/02/04/5289006.aspx

dlmallocnedmalloc http://blog.csdn.net/oldworm/archive/2010/02/04/5289010.aspx

《線程關聯內存池》 http://blog.csdn.net/oldworm/archive/2010/02/04/5289015.aspx

《線程關聯內存池再提速》 http://blog.csdn.net/oldworm/archive/2010/02/04/5289018.aspx

 

四、               定時器

關於定時器,上面講線程組的時候已經講過,我現在的設計是每個線程(包括主線程)都支持定時器,調用方法都是一樣的,回調函數形式也是一樣的,由於定時器放到各組線程裏面,所以減少了線程之間的切換,提高了效率。

關於定時器,可參考《定時器模塊改造》 http://blog.csdn.net/oldworm/archive/2010/09/11/5877425.aspx

 

五、               包格式

關於包格式可參考《常用cs程序自定義數據包描述》 http://blog.csdn.net/oldworm/archive/2010/03/24/5413013.aspx

 

六、               Buffer

之前的文章其實我一直沒有提過我的buffer,其實我的buffer設計是很靈活的,現在它和pool也是有些關聯的,我的poolset其實底下就是按照各種不同大小的buffer預設的尺寸。Buffer我設計爲循環式,不允許迴繞,包含

Char *pbase 塊基址

Char *pread 當前讀指針

Char *pwrite 當前寫指針

DWORD tag;

Buffer *next;

Capacity 總分配尺寸,上面分配的時候可能只是指定了19,但實際可能分配的是32個字節,所以內部用的時候要根據capacity來最大限度的利用緩衝區。

Buffer分配還利用了一個技巧,事實上分配的時候是一次分配一個需要的大緩衝,前面爲Buffer自身的數據,後面爲數據部分,pbase指向數據部分,這樣處理減少了一次分配,我估計很多人都在用這個技巧。

Pwrite總是不會小於pread的,但pread可能和pbase不一樣,僅當後面空餘空間不夠用的時候纔可能會移動數據,否則數據不會移動。

WSARecv的時候我是這麼處理的,如果首次獲取了一個包的一部分,但buffer中還有足夠的空間放下包的剩餘部分,我不會再分配一個bufferrecv,而是直接用原buffer指定一個合適的偏移和sizeWSARecv,這樣可以最大限度的減少複製。

剛纔還有朋友問到我recv的層次組織,我的網絡庫裏面是這樣組織的,OnRecv是個虛函數,最基礎的IocpClientOnRecv只處理數據而不解析格式,IocpClientMsg就會認識默認的一種包格式,這個類的OnRecv會將m_recvbuf中的數據組織爲msg,並儘可能的一次返回更多個msg,回調OnMsg函數,由上層決定該消息在哪個線程處理,這樣我認爲是最靈活的,如果是個很小的server,可能直接就在io線程裏面處理了,也可postevent到同步線程處理,亦可PostEvent到異步線程處理。

 

七、               TLSINFO

TlsInfo顧名思義就是每個線程關聯的一組數據,暫時我還沒有看到別人這麼設計,也許我設計得有些複雜了,在這個數據裏面有一些常用的和該線程相關的數據,如該線程的分配基、步長,用這兩個參數可讓每個線程製造出唯一序列,還有常用pool的地址,如tm_pool *p1k; tm_pool *p2k;… 這樣設計使得要分配的時候直接取tm_pool,最大限度的發揮了分配速度,還有一些常規參量long c; long d; DWORD a; DWORD b;… 這幾個值可理解爲棧內值,其實爲了減少上層調用複雜度的,如我將一個連接的包從io線程PostEvent到同步線程處理,PostEvent首參數就是tlsinfoPostEvent會根據tlsinfo裏面的一個內部值決定是不是要調用addref,因爲我有個地方預增了2,所以大多數情況下在io發到其他線程的時候是無需調用addref的,提高了效率,tlsinfo裏的其他一些值上層應用可使用,用在邏輯處理等情況下。

 

八、               性能分析

*nix下有很多知名的網絡庫,但在win下特別是使用iocp的庫裏面,一直就沒有一個能作爲基準的庫,即使asio也因爲出來太晚不爲大多數人熟悉而不能成爲基準庫,libeventiocp由於採用0 buffer模擬所以也沒有發揮出足夠的性能,對比spserver我比它快70%左右,我總在想要是微軟能將他那個iocp的例子寫得更好一點就好了,至少學的人有一個更高一點的基礎,而不至於讓http://www.codeproject.com/KB/IP/iocp_server_client.aspx這樣的垃圾代碼都能成爲很多人的樣板。

 

九、               雜談

爲了寫好一個win下穩定高效的網絡庫,我07年的時候幾乎搜遍了那個時間段之前所有能找到的iocp例子,還包括通過朋友等途徑看到的如snda等網絡庫,可惜真沒找到好的,大多數例子是隻要多線程發起幾千個連接不斷髮送數據馬上就死了,偶爾幾個不死的(包括snda的)只要隨機連接並斷開就會產生句柄泄漏,關閉所有連接之後句柄並不關閉等,也就是說這些例子連基本的生存期管理都沒搞定,能通過生存期管理並且不死的只有有限的幾個,可惜性能又太差,杯具啊。

早年寫網絡庫的時候也加入了sodmegoogle上建的那個羣,當時羣還是很熱鬧的,可惜大多數人都是摸索,所以很多問題只是討論卻從無定論,沒有誰能說服別人,也沒有人可輕易被說服,要是現在或許有一些很有經驗的人,可惜那個羣由於GFW現在雖能訪問也不大活躍了。

最近看到有些寫網絡程序7年甚至更久的人還在用libeventace等感想很複雜,可悲的是那些人還沒意識到用一個庫和寫一個庫有多大的區別,可能那些人一輩子也認識不到寫一個庫比用一個庫難多少,那些人以爲這些庫基本會用了,讓他自己去寫也基本是照這個模式,不會有什麼突破,就無需自己動手了,悲哀啊。當然,要寫一個穩定的網絡庫需要耗費很多時間,特別是要寫一個能和知名庫性能接近或更好的庫,更是要費神費力,沒點耐心和持久力是不可能做好的。在中文領域隨便查什麼稍有些名氣的代碼,總是能找到很多剖析類文章,可原創的東西總是很少,也不知道那些大俠怎麼搞的,什麼都能剖析可怎麼總寫不出什麼像樣的東西呢。

其實本來沒有打算寫這篇文章,可能是看了陳碩的muduo才使得我有了寫出來的衝動,大概是受到他的開源鼓勵吧。

謹以此文記錄本人最近3年對網絡模塊的修改並簡短總結。

 

 

發佈了61 篇原創文章 · 獲贊 5 · 訪問量 16萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章