大数据学习环境搭建系列(六)文件目录与文件操作

CDA数据分析师 出品

概述

在正式进入Hadoop集群安装前,我们还需掌握Linux系统一系列基本操作方法和常用的工具软件的安装及使用方法。首先理解一下本文中的文件目录文件概念。

文件目录:类似windos系统下的文件夹,里面可以包含若干文件目录或文件。

文件:即我们常见的文本文档、软件包、mp3等都属于文件。

认识终端

后面的操作都需要在终端命令行中操作,所以我们使用Ubuntu操作系统来简单了解一下Linux终端,打开我们之前创建的虚拟机并登陆。

进入Ubuntu系统后执行快捷键组合Ctrl+Alt+T即可打开终端,如下图所示终端第一行显示为**hduser@master:~$**这段代码,后面我们安装配置分布式集群系统时会经常见到它,所以我来解释一下终端中这段代码的含义。

**hduser:**为当前登录的用户名

master:为当前虚拟机的名字

~:代表当前用户主目录“/home/hduser”

$:当我们执行一些操作时,操作命令就写在这个位置然后回车就可以执行啦

如果终端中有很多命令看着不爽,我们可以输入clear命令来请清屏,清屏前后效果如下图所示,屏幕被命令占满

执行clear命令后屏幕被清理

文件目录结构

Linux的目录结构为树状结构,最顶级目录是根目录表示为‘/’,其他文件目录或文件都在根目录下或其子目录下。上层文件目录与下层文件夹间用‘/’间隔。例如我们的hduser的路径表示为“/home/hduser”,表示hduser目录位于‘/’根目录下的‘home’目录下。下图为Linux文件目录示意图:

上图中的几个文件是我们之后搭建集群时会经常用到的,这里简单介绍一下

/etc : 系统管理及配置文件一般都在这个文件夹里,我们会在后面集群搭建时将配置文件放到/etc/profile文件中。

/usr: 用户的很多应用程序和文件都放在这个目录下,类似于windows下的program files目录,后面我们用到的jdk及scala一般都安装在这里。

/home: 用户主目录的基点,比如用户hduser的主目录就是/home/hduser,也可以用’~’表示,集群搭建时我们会将Hadoop、spark、hive、hbase等安装在/home/hduser下。

/root:系统管理员的主目录

文件目录操作

我们对文件目录结构有初步了解后开始学习Linux系统文件目录的常用操作。这里有个知识还需要跟大家介绍一下:文件目录的绝对路径与相对路径。

绝对路径:路径由根目录 / 写起,例如: /home/hduser/a 这个目录。

相对路径:路径不是由 / 写起,例如从 /home/hudser/a 要到 /home/hadoop/b 底下时,可以写成: cd 这里“…/hadoop/b”就是相对路径的写法。

处理目录的常用操作有:

ls:查看文件

pwd:显示当前目录

cd:跳转到其他目录

mkdir:创建目录

mv:移动目录

cp:复制目录

rm:删除目录

查看文件目录使用命令ls,命令格式:

ls [-adl] 目录名称

选项与参数:

-a :显示所有文件,包含隐藏文件(以‘.’开头的文件)

-d:仅列出目录本身,而不是列出目录内的文件数据

-l:递归创建多级目录

显示当前目录使用命令pwd(Print Working Directory),命令格式:

pwd [-P] 目录名称

选项与参数:

-P :显示出真实的路径,而非使用连结 (link) 路径,类似Windows下的快捷方式。

注:为大写的P。

跳转到其他路径使用命令cd,命令格式:

cd [相对路径或绝对路径]

选项与参数:

参数为相对路径或绝对路径时跳转到指定目录。

当参数为空时则跳转到当前用户主目录

创建文件目录使用命令mkdir,命令格式:

mkdir [-p] 目录名称

选项与参数:

-p :递归创建多级目录

移动文件目录使用命令mv,命令格式:

mv [-bfiut] 源文件或目录 目标文件或目录

选项与参数:

-b :若需覆盖文件,则覆盖前先行备份

-f :若需覆盖文件,则覆盖前先行备份

-i :若目标文件或目录已经存在时,就会询问是否覆盖

-u :若目标文件或目录已经存在,且源文件或目录比较新,才会更新

-t :指定mv的目标目录,该选项适用于移动多个源文件到一个目录的情况此时目标目录在前,源文件在后。

复制文件目录使用命令cp,命令格式:

cp [-adfipru] 源文件或目录 目标文件或目录

选项与参数:

-a:若相当于 -pdr 的意思,至于 pdr 请参考下列说明;(常用)

-d:若来源档为连结档的属性(link file),则复制连结档属性而非文件本身;

-f:为强制(force)的意思,若目标文件已经存在且无法开启,则移除后再尝试一次;!

-i:若目标档(destination)已经存在时,在覆盖时会先询问动作的进行

-p:连同文件的属性一起复制过去,而非使用默认属性(备份常用);

-r:递归持续复制,用于目录的复制行为;

-u:若目标文件或目录比源文件或目录旧则升级目标文件或目录。

删除文件目录使用命令rm,命令格式:

rm [-fir] 目标文件或目录

选项与参数:

-f :忽略不存在的文件,不会出现警告信息;

-i :互动模式,在删除前会询问使用者是否动作

-r :递归删除,常用在目录的删除,慎重啊小伙伴们

好啦,今天的内容就这些,明天我们讲解一下用户管理及文件的属性。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章