原创 GlusterFS :Addbrick工作流程分析

1、工作流程分析 步驟說明: 1、  Cli接收到用戶的輸入後,對命令進行解析,判斷命令是否合法(命令格式,字符拼寫等檢查),然後RPC調用本機的glusterd程序的遠程函數,glusterd程序開始解析addbrick的命令行,

原创 HDFS之Qurom Journal Manager(QJM)實現機制分析

1.前言 1.1背景     自從hadoop2版本開始,社區引入了NameNode高可用方案。NameNode主從節點間需要同步操作日誌來達到主從節點元數據一致。最初業界均通過NFS來實現日誌同步,大家之所以選擇NFS,一方面因爲可以

原创 分佈式存儲系統(GlusterFS,Swift,Cassandra)設計對比

幾年下來,前前後後接觸過幾個存儲系統了,感覺接觸多了,發現不同系統在設計的時候大都採用相似的理論,因此就梳理下。   GlusterFS Swift Cassandra 路由算法 普通哈希算法 一致性哈希算法

原创 hadoop2之HDFS分析:Client與DataNode流程分析

Client與DataNode流程分析 1.寫文件流程   1)  Client執行create方法,調用NameNode的create方法,同時在Client端啓動datastream線程; 2)  Client調用write方法,w

原创 HDFS應用場景分析

原文來自雲臺博客:http://yuntai.1kapp.com/?p=954         雖然說之前也對HDFS的應用場景有個大致的認識,但是總感覺不是十分徹底,因此前幾天花了點時間進行了整理,現在把它貼出來。       1.概況

原创 HDFS2.X源碼分析之:NameNode對幾種塊的處理方式

原文出自雲臺博客:http://yuntai.1kapp.com/?p=935        在NameNode接受數據塊報告的過程中,會檢查塊的副本中是否有無效塊,壞塊,無效塊,和塊的副本數不夠問題,由於這部分涉及到NameNode對

原创 那點總結

        一直想爲上次的事情總結點什麼,一直覺得自己有很多的經驗教訓是可以總結的,但是總是替自己找藉口,今天晚上終於下定決心寫幾條: 1、  找合夥人很難,要找對的合夥人就難上加難,即時是的你的同學,朋友,即時看上去他的加入讓團隊

原创 HDFS2.X源碼分析之:NameNode塊報告處理

原文出自雲臺博客:http://yuntai.1kapp.com/?p=941       NameNode會接收兩種情況的塊報告,DataNode全部塊報告與增量塊報告。 4.1全量報告分析        目前全量報告以週期性進行報告,

原创 HDFS2.X源碼分析之:NameNode讀文件原理

原文出自雲臺博客:http://yuntai.1kapp.com/?p=952 HDFS被設計成寫一次,讀多次的應用場景,這應該跟它的MapReduce機制是緊密關聯的,通過對線上的讀寫比例監控,大概讀寫比是10:1,也驗證了它設計的目標

原创 HDFS2.X:系統時間戳機制在塊報告中的應用

        在數據塊報告過程中,如果遇到報告的塊的時間戳大於從節點NameNode的時間戳,會將這樣的數據塊放入一個消息隊列,等從節點消化到相關的塊信息,再從消息隊列中取出數據塊,建立塊信息與副本的映射關係。這樣,報告的塊是放入消息隊

原创 數組,transferFrom,ByteBuffer數據傳輸對比

package cache; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java

原创 HDFS之Bookkeeper工作原理分析

1.前言 1.1背景     自從hadoop2版本開始,社區引入了NameNode高可用方案。NameNode主從節點間需要同步操作日誌來達到主從節點元數據一致。最初業界均通過NFS來實現日誌同步,大家之所以選擇NFS,一方面因爲可以很

原创 HDFS:不同版本評比分析

1、版本功能對比 版本名稱 版本時間 功能名稱 說明 0.20.x 2009.4.22-2011.10.17 目前線上基本功能 Avatarnode,cloudera3均以該版本作爲基礎版本 0.23.

原创 hadoop2.X之HDFS集羣管理:ReplicationMonitor

原文出自雲臺博客:http://yuntai.1kapp.com/?p=930       ReplicationMonitor在HDFS中的工作相當重要,首先不僅會負責爲副本不足的數據塊選擇source 數據節點,選擇冗餘的targ

原创 linux操作系統緩存(cache)效果測試

測試文件大小:4.5GB; 第一次將該文件傳輸到另外一臺機器: Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz