HDFS Commands

原創

2020-02-23 07:09

命令基本格式:

hadoop fs -cmd < args >

1.ls

hadoop fs -ls  /

hadoop fs -ls -R /

列出hdfs文件系統所有的目錄和文件

2.put

hadoop fs -put < local file > < hdfs file >

hdfs file的父目錄一定要存在，否則命令不會執行

hadoop fs -put  < local file or dir >...< hdfs dir >

hdfs dir 一定要存在，否則命令不會執行

hadoop fs -put - < hdsf  file>

從鍵盤讀取輸入到hdfs file中，按Ctrl+D結束輸入，hdfs file不能存在，否則命令不會執行

2.1.moveFromLocal

hadoop fs -moveFromLocal  < local src > ... < hdfs dst >

與put相類似，命令執行後源文件 local src 被刪除，也可以從從鍵盤讀取輸入到hdfs file中

2.2.copyFromLocal

hadoop fs -copyFromLocal  < local src > ... < hdfs dst >

與put相類似，也可以從從鍵盤讀取輸入到hdfs file中

3.get

hadoop fs -get < hdfs file > < local file or dir>

local file不能和 hdfs file名字不能相同，否則會提示文件已存在，沒有重名的文件會複製到本地

hadoop fs -get < hdfs file or dir > ... < local  dir >

拷貝多個文件或目錄到本地時，本地要爲文件夾路徑
注意：如果用戶不是root， local 路徑要爲用戶文件夾下的路徑，否則會出現權限問題，

3.1.moveToLocal

當前版本中還未實現此命令

3.2.copyToLocal


hadoop fs -copyToLocal < local src > ... < hdfs dst >

與get相類似

4.rm

hadoop fs -rm < hdfs file > ...
hadoop fs -rm -r < hdfs dir>...

每次可以刪除多個文件或目錄

5.mkdir

hadoop fs -mkdir < hdfs path>

只能一級一級的建目錄，父目錄不存在的話使用這個命令會報錯

hadoop fs -mkdir -p < hdfs path>

所創建的目錄如果父目錄不存在就創建該父目錄

6.getmerge

hadoop fs -getmerge < hdfs dir > < local file >

將hdfs指定目錄下所有文件排序後合併到local指定的文件中，文件不存在時會自動創建，文件存在時會覆蓋裏面的內容

hadoop fs -getmerge -nl  < hdfs dir >  < local file >

加上nl後，合併到local file中的hdfs文件之間會空出一行

7.cp

hadoop fs -cp  < hdfs file >  < hdfs file >

目標文件不能存在，否則命令不能執行，相當於給文件重命名並保存，源文件還存在

hadoop fs -cp < hdfs file or dir >... < hdfs dir >

目標文件夾要存在，否則命令不能執行

8.mv

hadoop fs -mv < hdfs file >  < hdfs file >

目標文件不能存在，否則命令不能執行，相當於給文件重命名並保存，源文件不存在

hadoop fs -mv  < hdfs file or dir >...  < hdfs dir >

源路徑有多個時，目標路徑必須爲目錄，且必須存在。
注意：跨文件系統的移動（local到hdfs或者反過來）都是不允許的

9.count

hadoop fs -count < hdfs path >

統計hdfs對應路徑下的目錄個數，文件個數，文件總計大小
顯示爲目錄個數，文件個數，文件總計大小，輸入路徑

10.du

hadoop fs -du < hdsf path>

顯示hdfs對應路徑下每個文件夾和文件的大小

hadoop fs -du -s < hdsf path>

顯示hdfs對應路徑下所有文件和的大小

hadoop fs -du - h < hdsf path>

顯示hdfs對應路徑下每個文件夾和文件的大小,文件的大小用方便閱讀的形式表示，例如用64M代替67108864

11.text

hadoop fs -text < hdsf file>

將文本文件或某些格式的非文本文件通過文本格式輸出

12.setrep

hadoop fs -setrep -R 3 < hdfs path >

改變一個文件在hdfs中的副本個數，上述命令中數字3爲所設置的副本個數，-R選項可以對一個人目錄下的所有目錄+文件遞歸執行改變副本個數的操作

13.stat

hdoop fs -stat [format] < hdfs path >

返回對應路徑的狀態信息
[format]可選參數有：%b（文件大小），%o（Block大小），%n（文件名），%r（副本個數），%y（最後一次修改日期和時間）
可以這樣書寫hadoop fs -stat %b%o%n < hdfs path >，不過不建議，這樣每個字符輸出的結果不是太容易分清楚

14.tail

hadoop fs -tail < hdfs file >

在標準輸出中顯示文件末尾的1KB數據

15.archive

hadoop archive -archiveName name.har -p < hdfs parent dir > < src >* < hdfs dst >

命令中參數name：壓縮文件名，自己任意取；< hdfs parent dir > ：壓縮文件所在的父目錄；< src >：要壓縮的文件名；< hdfs dst >：壓縮文件存放路徑
*示例：hadoop archive -archiveName hadoop.har -p /user 1.txt 2.txt /des
示例中將hdfs中/user目錄下的文件1.txt，2.txt壓縮成一個名叫hadoop.har的文件存放在hdfs中/des目錄下，如果1.txt，2.txt不寫就是將/user目錄下所有的目錄和文件壓縮成一個名叫hadoop.har的文件存放在hdfs中/des目錄下
顯示har的內容可以用如下命令：

hadoop fs -ls /des/hadoop.jar

顯示har壓縮的是那些文件可以用如下命令

hadoop fs -ls -R har:///des/hadoop.har

注意：har文件不能進行二次壓縮。如果想給.har加文件，只能找到原來的文件，重新創建一個。har文件中原來文件的數據並沒有變化，har文件真正的作用是減少NameNode和DataNode過多的空間浪費。

16.balancer

hdfs balancer

如果管理員發現某些DataNode保存數據過多，某些DataNode保存數據相對較少，可以使用上述命令手動啓動內部的均衡過程

17.dfsadmin

hdfs dfsadmin -help

管理員可以通過dfsadmin管理HDFS，用法可以通過上述命令查看

hdfs dfsadmin -report

顯示文件系統的基本數據

hdfs dfsadmin -safemode < enter | leave | get | wait >

enter：進入安全模式；leave：離開安全模式；get：獲知是否開啓安全模式；
wait：等待離開安全模式

18.distcp

用來在兩個HDFS之間拷貝數據

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

HDFS Commands

1.ls

2.put

2.1.moveFromLocal

2.2.copyFromLocal

3.get

3.1.moveToLocal

3.2.copyToLocal

4.rm

5.mkdir

6.getmerge

7.cp

8.mv

9.count

10.du

11.text

12.setrep

13.stat

14.tail

15.archive

16.balancer

17.dfsadmin

18.distcp

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

ganglia For Hadoop, Hbase

MapReduce II

Flume Note

HDFS Commands

Hadoop Fully distributed mode

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結