hadoop 命令

在這篇文章中,我們默認認爲Hadoop環境已經由運維人員配置好直接可以使用。

假設Hadoop的安裝目錄HADOOP_HOME爲/home/admin/hadoop。

啓動與關閉

啓動Hadoop

1.         進入HADOOP_HOME目錄。

2.         執行sh bin/start-all.sh

關閉Hadoop

1.         進入HADOOP_HOME目錄。

2.         執行sh bin/stop-all.sh

文件操作

Hadoop使用的是HDFS,能夠實現的功能和我們使用的磁盤系統類似。並且支持通配符,如*。

查看文件列表

查看hdfs中/user/admin/aaron目錄下的文件。

1.         進入HADOOP_HOME目錄。

2.         執行sh bin/hadoop fs -ls /user/admin/aaron

這樣,我們就找到了hdfs中/user/admin/aaron目錄下的文件了。

我們也可以列出hdfs中/user/admin/aaron目錄下的所有文件(包括子目錄下的文件)。

1.         進入HADOOP_HOME目錄。

2.         執行sh bin/hadoop fs -lsr /user/admin/aaron

創建文件目錄

查看hdfs中/user/admin/aaron目錄下再新建一個叫做newDir的新目錄。

1.         進入HADOOP_HOME目錄。

2.         執行sh bin/hadoop fs -mkdir /user/admin/aaron/newDir

刪除文件

刪除hdfs中/user/admin/aaron目錄下一個名叫needDelete的文件

1.         進入HADOOP_HOME目錄。

2.         執行sh bin/hadoop fs -rm /user/admin/aaron/needDelete

刪除hdfs中/user/admin/aaron目錄以及該目錄下的所有文件

1.         進入HADOOP_HOME目錄。

2.         執行sh bin/hadoop fs -rmr /user/admin/aaron

上傳文件

上傳一個本機/home/admin/newFile的文件到hdfs中/user/admin/aaron目錄下

1.         進入HADOOP_HOME目錄。

2.         執行sh bin/hadoop fs –put /home/admin/newFile /user/admin/aaron/

下載文件

下載hdfs中/user/admin/aaron目錄下的newFile文件到本機/home/admin/newFile中

1.         進入HADOOP_HOME目錄。

2.         執行sh bin/hadoop fs –get /user/admin/aaron/newFile /home/admin/newFile

查看文件

我們可以直接在hdfs中直接查看文件,功能與類是cat類似

查看hdfs中/user/admin/aaron目錄下的newFile文件

1.         進入HADOOP_HOME目錄。

2.         執行sh bin/hadoop fs –cat /home/admin/newFile

MapReduce Job操作

提交MapReduce Job

原則上說,Hadoop所有的MapReduce Job都是一個jar包。

運行一個/home/admin/hadoop/job.jar的MapReduce Job

1.         進入HADOOP_HOME目錄。

2.         執行sh bin/hadoop jar /home/admin/hadoop/job.jar [jobMainClass] [jobArgs]

殺死某個正在運行的Job

假設Job_Id爲:job_201005310937_0053

1.         進入HADOOP_HOME目錄。

2.         執行sh bin/hadoop job -kill job_201005310937_0053

更多Hadoop的命令

上面介紹的這些Hadoop的操作命令是我們最常用的。如果你希望瞭解更多,可以按照如下的方式獲取命令的說明信息。

1.         進入HADOOP_HOME目錄。

2.         執行sh bin/hadoop

我們可以看到更多命令的說明信息:

Usage: hadoop [--config confdir] COMMAND

where COMMAND is one of:

  namenode -format     format the DFS filesystem

  secondarynamenode    run the DFS secondary namenode

  namenode             run the DFS namenode

  datanode             run a DFS datanode

  dfsadmin             run a DFS admin client

  fsck                 run a DFS filesystem checking utility

  fs                   run a generic filesystem user client

  balancer             run a cluster balancing utility

  jobtracker           run the MapReduce job Tracker node

  pipes                run a Pipes job

  tasktracker          run a MapReduce task Tracker node

  job                  manipulate MapReduce jobs

  queue                get information regarding JobQueues

  version              print the version

  jar <jar>            run a jar file

  distcp <srcurl> <desturl> copy file or directories recursively

  archive -archiveName NAME <src>* <dest> create a hadoop archive

  daemonlog            get/set the log level for each daemon

 or

  CLASSNAME            run the class named CLASSNAME

Most commands print help when invoked w/o parameters.




http://www.cnblogs.com/gpcuster/archive/2010/06/04/1751538.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章