如果從hadoop的單元測試開始研究源碼的話,就不得不說下MiniDFSCluster。
MiniDFSCluster是一個本地單進程的模擬hdfs集羣框架。
0.1.0版的比較簡單,就以下幾個內容:
1)NameNodeRunner:用來開啓NameNode的一個線程;
2)DataNodeRunner:用來開啓DataNode的一個線程;
3)shutdown方法:用來關閉上面開啓的NameNode與DataNode;
4)getFileSystem方法:得到模擬hdfs的文件系統;
後期的版本還提供了一個模擬mapreduce的集羣框架MiniMRCluster。