Hadoop如何將TB級大文件的上傳性能優化上百倍？

原創

zhuguanghalo

2019-06-11 09:43

這篇文章，我們來看看，Hadoop的HDFS分佈式文件系統的文件上傳的性能優化。

首先，我們還是通過一張圖來回顧一下文件上傳的大概的原理。

由上圖所示，文件上傳的原理，其實說出來也簡單。

比如有個TB級的大文件，太大了，HDFS客戶端會給拆成很多block，一個block就是128MB。

這個HDFS客戶端你可以理解爲是雲盤系統、日誌採集系統之類的東西。

比如有人上傳一個1TB的大文件到網盤，或者是上傳個1TB的大日誌文件。

然後，HDFS客戶端把一個一個的block上傳到第一個DataNode
　　
　第一個DataNode會把這個block複製一份，做一個副本發送給第二個DataNode。

第二個DataNode發送一個block副本到第三個DataNode。
　　
所以你會發現，一個block有3個副本，分佈在三臺機器上。任何一臺機器宕機，數據是不會丟失的。

最後，一個TB級大文件就被拆散成了N多個MB級的小文件存放在很多臺機器上了，這不就是分佈式存儲麼?

二、原始的文件上傳方案

今天要討論的問題，就是那個HDFS客戶端上傳TB級大文件的時候，到底是怎麼上傳呢?

我們先來考慮一下，如果用一個比較原始的方式來上傳，應該怎麼做?

大概能想到的是下面這個圖裏的樣子。

很多java的初學者，估計都知道這樣來上傳文件，其實無非就是不停的從本地磁盤文件用輸入流讀取數據，讀到一點，就立馬通過網絡的輸出流寫到DataNode裏去。

上面這種流程圖的代碼，估計剛畢業的同學都可以立馬寫出來。因爲對文件的輸入流最多就是個FileInputStream。

而對DataNode的輸出流，最多就是個Socket返回的OutputStream。

然後中間找一個小的內存byte[]數組，進行流對拷就行了，從本地文件讀一點數據，就給DataNode發一點數據。

但是如果你要這麼弄，那性能真是極其的低下了，網絡通信講究的是適當頻率，每次batch批量發送，你得讀一大批數據，通過網絡通信發一批數據。

不能說讀一點點數據，就立馬來一次網絡通信，就發出去這一點點的數據。

如果按照上面這種原始的方式，絕對會導致網絡通信效率極其低下，大文件上傳性能很差。

爲什麼這麼說呢?

相當於你可能剛讀出來幾百個字節的數據，立馬就寫網絡，卡頓個比如幾百毫秒。

然後再讀下一批幾百個字節的數據，再寫網絡卡頓個幾百毫秒，這個性能很差，在工業級的大規模分佈式系統中，是無法容忍的。

三、HDFS對大文件上傳的性能優化

好，看完了原始的文件上傳，那麼我們來看看，Hadoop中的大文件上傳是如何優化性能的呢?一起來看看下面那張圖。

首先你需要自己創建一個針對本地TB級磁盤文件的輸入流。

然後讀到數據之後立馬寫入HDFS提供的FSDataOutputStream輸出流。

這個FSDataOutputStream輸出流在幹啥?

大家覺得他會天真的立馬把數據通過網絡傳輸寫給DataNode嗎?

答案當然是否定的了!這麼幹的話，不就跟之前的那種方式一樣了!

1. Chunk緩衝機制

首先，數據會被寫入一個chunk緩衝數組，這個chunk是一個512字節大小的數據片段，你可以這麼來理解。

然後這個緩衝數組可以容納多個chunk大小的數據在裏面緩衝。

光是這個緩衝，首先就可以讓客戶端快速的寫入數據了，不至於說幾百字節就要進行一次網絡傳輸，想一想，是不是這樣?

2. Packet數據包機制

接着，當chunk緩衝數組都寫滿了之後，就會把這個chunk緩衝數組進行一下chunk切割，切割爲一個一個的chunk，一個chunk是一個數據片段。

然後多個chunk會直接一次性寫入另外一個內存緩衝數據結構，就是Packet數據包。

一個Packet數據包，設計爲可以容納127個chunk，大小大致爲64mb。所以說大量的chunk會不斷的寫入Packet數據包的內存緩衝中。

通過這個Packet數據包機制的設計，又可以在內存中容納大量的數據，進一步避免了頻繁的網絡傳輸影響性能。

3. 內存隊列異步發送機制

當一個Packet被塞滿了chunk之後，就會將這個Packet放入一個內存隊列來進行排隊。

然後有一個DataStreamer線程會不斷的獲取隊列中的Packet數據包，通過網絡傳輸直接寫一個Packet數據包給DataNode。

如果一個Block默認是128mb的話，那麼一個Block默認會對應兩個Packet數據包，每個Packet數據包是64MB。

也就是說，傳送兩個Packet數據包給DataNode之後，就會發一個通知說，一個Block的數據都傳輸完畢。

這樣DataNode就知道自己收到一個Block了，裏面包含了人家發送過來的兩個Packet數據包。

四、總結

OK，大家看完了上面的那個圖以及Hadoop採取的大文件上傳機制，是不是感覺設計的很巧妙?

說白了，工業級的大規模分佈式系統，都不會採取特別簡單的代碼和模式，那樣性能很低下。

這裏都有大量的併發優化、網絡IO優化、內存優化、磁盤讀寫優化的架構設計、生產方案在裏面。

所以大家觀察上面那個圖，HDFS客戶端可以快速的將tb級大文件的數據讀出來，然後快速的交給HDFS的輸出流寫入內存。

基於內存裏的chunk緩衝機制、packet數據包機制、內存隊列異步發送機制。絕對不會有任何網絡傳輸的卡頓，導致大文件的上傳速度變慢。

反而通過上述幾種機制，可以上百倍的提升一個TB級大文件的上傳性能。

覺得不錯請點贊支持，歡迎留言或進我的個人羣855801563領取【架構資料專題目合集90期】、【BATJTMD大廠JAVA面試真題1000+】，本羣專用於學習交流技術、分享面試機會，拒絕廣告，我也會在羣內不定期答題、探討

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Hadoop如何將TB級大文件的上傳性能優化上百倍？

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

本地SSL證書過期輸入命令在IIS自動生成

.NET週刊【5月第2期 2024-05-12】

什麼是Spring源碼？阿里十年架構師僅用一篇文檔總結，秒懂

程序員才能看得懂的段子，內含表情包，喫飯的時候別點!

京東商城Java崗4面斬獲offer：Spring+MySQL+索引+JVM等

消息中間件面試題：如何保證消息不被重複消費

Linux的優缺點，Linux與Windows的區別

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結