Linux系列1:文件內容查閱

0 引言

如果我們要查閱一個文件的內容時,該如何是好呢? 最常使用的顯示文件內容的命令可以說是 cat 與 more 及 less 了!此外,如果我們要查看一個很大型的文件 (好幾百MB時),但是我們只需要後端的幾行字而已,那麼該如何是好?用 tail 呀,此外, tac 這個命令也可以達到!好了,說說各個命令的用途吧!

  • cat 由第一行開始顯示文件內容
  • tac 從最後一行開始顯示,可以看出 tac 是 cat 的倒著寫!
  • nl 顯示的時候,順道輸出行號!
  • more 一頁一頁的顯示文件內容
  • less 與 more 類似,但是比 more 更好的是,他可以往前翻頁!
  • head 只看頭幾行
  • tail 只看尾巴幾行
  • od 以二進位的方式讀取文件內容!

1 直接查看文件內容 cat, tac, nl

1.1 cat(concatenate)

[root@www ~]# cat [-AbEnTv]
選項與參數:
-A  :相當於 -vET 的整合選項,可列出一些特殊字符而不是空白而已;
-b  :列出行號,僅針對非空白行做行號顯示,空白行不標行號!
-E  :將結尾的斷行字節 $ 顯示出來;
-n  :列印出行號,連同空白行也會有行號,與 -b 的選項不同;
-T  :將 [tab] 按鍵以 ^I 顯示出來;
-v  :列出一些看不出來的特殊字符

範例一:檢閱 /etc/issue 這個文件的內容
[root@www ~]# cat /etc/issue
CentOS release 5.3 (Final)
Kernel \r on an \m

範例二:承上題,如果還要加印行號呢?
[root@www ~]# cat -n /etc/issue
     1  CentOS release 5.3 (Final)
     2  Kernel \r on an \m
     3
# 看到了吧!可以印出行號呢!這對於大文件要找某個特定的行時,有點用處!
# 如果不想要編排空白行的行號,可以使用『cat -b /etc/issue』,自己測試看看:

範例三:將 /etc/xinetd.conf 的內容完整的顯示出來(包含特殊字節)
[root@www ~]# cat -A /etc/xinetd.conf
#$
....(中間省略)....
$
defaults$
{$
# The next two items are intended to be a quick access place to$
....(中間省略)....
^Ilog_type^I= SYSLOG daemon info $
^Ilog_on_failure^I= HOST$
^Ilog_on_success^I= PID HOST DURATION EXIT$
....(中間省略)....
includedir /etc/xinetd.d$
 $
# 上面的結果限於篇幅,鳥哥刪除掉很多數據了。另外,輸出的結果並不會有特殊字體,
# 鳥哥上面的特殊字體是要讓您發現差異點在哪裏就是了。基本上,在一般的環境中,
# 使用 [tab] 與空白鍵的效果差不多,都是一堆空白啊!我們無法知道兩者的差別。
# 此時使用 cat -A 就能夠發現那些空白的地方是啥鬼東西了![tab]會以 ^I 表示,
# 斷行字節則是以 $ 表示,所以你可以發現每一行後面都是 $ 啊!不過斷行字節
# 在Windows/Linux則不太相同,Windows的斷行字節是 ^M$ 羅。
# 這部分我們會在第十章 vim 軟件的介紹時,再次的說明到喔!

1.2 tac(反向查看)

tac 剛好是將 cat 反寫過來,所以他的功能就跟 cat 相反啦, cat 是由『第一行到最後一行連續顯示在螢幕上』,而 tac 則是『 由最後一行到第一行反向在螢幕上顯示出來 』

[root@www ~]# tac /etc/issue

Kernel \r on an \m
CentOS release 5.3 (Final)
# 嘿嘿!與剛剛上面的範例一比較,是由最後一行先顯示喔!

1.3 nl (添加行號顯示)

nl 可以將輸出的文件內容自動的加上行號!其默認的結果與 cat -n 有點不太一樣, nl 可以將行號做比較多的顯示設計,包括位數與是否自動補齊 0 等等的功能呢。

[root@www ~]# nl [-bnw] 文件
選項與參數:
-b  :指定行號指定的方式,主要有兩種:
      -b a :表示不論是否爲空行,也同樣列出行號(類似 cat -n);
      -b t :如果有空行,空的那一行不要列出行號(默認值);
-n  :列出行號表示的方法,主要有三種:
      -n ln :行號在螢幕的最左方顯示;
      -n rn :行號在自己欄位的最右方顯示,且不加 0 ;
      -n rz :行號在自己欄位的最右方顯示,且加 0 ;
-w  :行號欄位的佔用的位數。

範例一:用 nl 列出 /etc/issue 的內容
[root@www ~]# nl /etc/issue
     1  CentOS release 5.3 (Final)
     2  Kernel \r on an \m

# 注意看,這個文件其實有三行,第三行爲空白(沒有任何字節),
# 因爲他是空白行,所以 nl 不會加上行號喔!如果確定要加上行號,可以這樣做:

[root@www ~]# nl -b a /etc/issue
     1  CentOS release 5.3 (Final)
     2  Kernel \r on an \m
     3
# 呵呵!行號加上來羅~那麼如果要讓行號前面自動補上 0 呢?可這樣

[root@www ~]# nl -b a -n rz /etc/issue
000001  CentOS release 5.3 (Final)
000002  Kernel \r on an \m
000003
# 嘿嘿!自動在自己欄位的地方補上 0 了~默認欄位是六位數,如果想要改成 3 位數?

[root@www ~]# nl -b a -n rz -w 3 /etc/issue
001     CentOS release 5.3 (Final)
002     Kernel \r on an \m
003
# 變成僅有 3 位數羅~

2 可翻頁查看 more,less

前面提到的 nl 與 cat, tac 等等,都是一次性的將數據一口氣顯示到螢幕上面,那有沒有可以進行一頁一頁翻動的命令啊? 讓我們可以一頁一頁的觀察,纔不會前面的數據看不到啊~呵呵!有的!那就是 more 與 less 羅~

2.1 more(向下翻頁)


[root@www ~]# more /etc/man.config
#
# Generated automatically from man.conf.in by the
# configure script.
#
# man.conf from man-1.6d
....(中間省略)....
--More--(28%)  <== 重點在這一行喔!你的光標也會在這裏等待你的命令

仔細的給他看到上面的範例,如果 more 後面接的文件內容行數大於屏幕輸出的行數時, 就會出現類似上面的圖示。重點在最後一行,最後一行會顯示出目前顯示的百分比, 而且還可以在最後一行輸入一些有用的命令喔!在 more 這個程序的運行過程中,你有幾個按鍵可以按的:

  • 空白鍵 (space):代表向下翻一頁;
  • Enter :代表向下翻『一行』;
  • /字串 :代表在這個顯示的內容當中,向下搜尋『字串』這個關鍵字;
  • :f :立刻顯示出檔名以及目前顯示的行數;
  • q :代表立刻離開 more ,不再顯示該文件內容。
  • b 或 [ctrl]-b :代表往回翻頁,不過這動作只對文件有用,對管線無用。

要離開 more 這個命令的顯示工作,可以按下 q 就能夠離開了。而要向下翻頁,就使用空白鍵即可。 比較有用的是搜尋字串的功能,舉例來說,我們使用『 more /etc/man.config 』來觀察該文件, 若想要在該文件內搜尋 MANPATH 這個字串時,可以這樣做:


[root@www ~]# more /etc/man.config
#
# Generated automatically from man.conf.in by the
# configure script.
#
# man.conf from man-1.6d
....(中間省略)....
/MANPATH   <== 輸入了 / 之後,光標就會自動跑到最底下一行等待輸入!

如同上面的說明,輸入了 / 之後,光標就會跑到最底下一行,並且等待你的輸入, 你輸入了字串並按下[enter]之後,嘿嘿! more 就會開始向下搜尋該字串羅~而重複搜尋同一個字串, 可以直接按下 n 即可啊!最後,不想要看了,就按下 q 即可離開 more 啦!

2.2 less(上下翻頁)

[root@www ~]# less /etc/man.config
#
# Generated automatically from man.conf.in by the
# configure script.
#
# man.conf from man-1.6d
....(中間省略)....
:   <== 這裏可以等待你輸入命令!

less 的用法比起 more 又更加的有彈性,怎麼說呢?在 more 的時候,我們並沒有辦法向前面翻, 只能往後面看,但若使用了 less 時,呵呵!就可以使用 [pageup] [pagedown] 等按鍵的功能來往前往後翻看文件,你瞧,是不是更容易使用來觀看一個文件的內容了呢!

除此之外,在 less 裏頭可以擁有更多的『搜尋』功能喔!不止可以向下搜尋,也可以向上搜尋~ 實在是很不錯用~基本上,可以輸入的命令有:

  • 空白鍵 :向下翻動一頁;
  • [pagedown]:向下翻動一頁;
  • [pageup] :向上翻動一頁;
  • /字串 :向下搜尋『字串』的功能;
  • ?字串 :向上搜尋『字串』的功能;
  • n :重複前一個搜尋 (與 / 或 ? 有關!)
  • N :反向的重複前一個搜尋 (與 / 或 ? 有關!)
  • q :離開 less 這個程序;

查閱文件內容還可以進行搜尋的動作~瞧~ less 是否很不錯用啊! 其實 less 還有很多的功能喔!詳細的使用方式請使用 man less 查詢一下啊!
你是否會覺得 less 使用的畫面與環境與 man page 非常的類似呢?沒錯啦!因爲man這個命令就是呼叫 less 來顯示說明文件的內容的! 現在你是否覺得 less 很重要呢? _

3 數據摘取 head, tail

我們可以將輸出的數據作一個最簡單的摘取,那就是取出前面 (head) 與取出後面 (tail) 文字的功能。 不過,要注意的是, head 與 tail 都是以『行』爲單位來進行數據擷取的喔!

3.1 head(取出前面幾行)

[root@www ~]# head [-n number] 文件 
選項與參數:
-n  :後面接數字,代表顯示幾行的意思

[root@www ~]# head /etc/man.config
# 默認的情況中,顯示前面十行!若要顯示前 20 行,就得要這樣:
[root@www ~]# head -n 20 /etc/man.config

範例:如果後面100行的數據都不列印,只列印/etc/man.config的前面幾行,該如何是好?
[root@www ~]# head -n -100 /etc/man.config

head 的英文意思就是『頭』啦,那麼這個東西的用法自然就是顯示出一個文件的前幾行羅! 沒錯!就是這樣!若沒有加上 -n 這個選項時,默認只顯示十行,若只要一行呢?那就加入『 head -n 1 filename 』即可!

另外那個 -n 選項後面的參數較有趣,如果接的是負數,例如上面範例的-n -100時,代表列前的所有行數, 但不包括後面100行。舉例來說,/etc/man.config共有141行,則上述的命令『head -n -100 /etc/man.config』 就會列出前面41行,後面100行不會列印出來了。

3.2 tail(取出後面幾行)


[root@www ~]# tail [-n number] 文件 
選項與參數:
-n  :後面接數字,代表顯示幾行的意思
-f  :表示持續偵測後面所接的檔名,要等到按下[ctrl]-c纔會結束tail的偵測

[root@www ~]# tail /etc/man.config
# 默認的情況中,顯示最後的十行!若要顯示最後的 20 行,就得要這樣:
[root@www ~]# tail -n 20 /etc/man.config

範例一:如果不知道/etc/man.config有幾行,卻只想列出100行以後的數據時?
[root@www ~]# tail -n +100 /etc/man.config

範例二:持續偵測/var/log/messages的內容
[root@www ~]# tail -f /var/log/messages
  <==要等到輸入[crtl]-c之後纔會離開tail這個命令的偵測!

有 head 自然就有 tail ( 尾巴 ) 羅!沒錯!這個 tail 的用法跟 head 的用法差不多類似,只是顯示的是後面幾行就是了!默認也是顯示十行,若要顯示非十行,就加 -n number 的選項即可。

範例一的內容就有趣啦!其實與head -n -xx有異曲同工之妙。當下達『tail -n +100 /etc/man.config』 代表該文件從100行以後都會被列出來,同樣的,在man.config共有141行,因此第100~141行就會被列出來啦! 前面的99行都不會被顯示出來喔!

至於範例二中,由於/var/log/messages隨時會有數據寫入,你想要讓該文件有數據寫入時就立刻顯示到螢幕上, 就利用 -f 這個選項,他可以一直偵測/var/log/messages這個文件,新加入的數據都會被顯示到螢幕上。 直到你按下[crtl]-c纔會離開tail的偵測喔!

例題:
假如我想要顯示 /etc/man.config 的第 11 到第 20 行呢?
答:
這個應該不算難,想一想,在第 11 到第 20 行,那麼我取前 20 行,再取後十行,所以結果就是:『 head -n 20 /etc/man.config | tail -n 10 』,這樣就可以得到第 11 到第 20 行之間的內容了! 但是裏面涉及到管線命令,需要在第三篇的時候纔講的到!
例題:
承上一題,那如果我想要列出正確的行號呢?就是屏幕上僅列出/etc/man_db.conf 的第11行到第20行,且有行號存在。
答:我們可以通過cat -n來顯示行號,然後再通過head/tail來摘取數據就行了。所以命令可以爲:cat -n /etc/man_db.conf | head -n 20 | tail -n 10

4 非文本文檔查看 od

我們上面提到的,都是在查閱純文字檔的內容。 那麼萬一我們想要查閱非文字檔,舉例來說,例如 /usr/bin/passwd 這個運行檔的內容時, 又該如何去讀出資訊呢?事實上,由於運行檔通常是 binary file ,使用上頭提到的命令來讀取他的內容時, 確實會產生類似亂碼的數據啊!那怎麼辦?沒關係,我們可以利用 od 這個命令來讀取喔!

[root@www ~]# od [-t TYPE] 文件
選項或參數:
-t  :後面可以接各種『類型 (TYPE)』的輸出,例如:
      a       :利用默認的字節來輸出;
      c       :使用 ASCII 字節來輸出
      d[size] :利用十進位(decimal)來輸出數據,每個整數佔用 size bytes ;
      f[size] :利用浮點數值(floating)來輸出數據,每個數佔用 size bytes ;
      o[size] :利用八進位(octal)來輸出數據,每個整數佔用 size bytes ;
      x[size] :利用十六進位(hexadecimal)來輸出數據,每個整數佔用 size bytes ;

範例一:請將/usr/bin/passwd的內容使用ASCII方式來展現!
[root@www ~]# od -t c /usr/bin/passwd
0000000 177   E   L   F 001 001 001  \0  \0  \0  \0  \0  \0  \0  \0  \0
0000020 002  \0 003  \0 001  \0  \0  \0 260 225 004  \b   4  \0  \0  \0
0000040 020   E  \0  \0  \0  \0  \0  \0   4  \0      \0  \a  \0   (  \0
0000060 035  \0 034  \0 006  \0  \0  \0   4  \0  \0  \0   4 200 004  \b
0000100   4 200 004  \b 340  \0  \0  \0 340  \0  \0  \0 005  \0  \0  \0
.....(後面省略)....
# 最左邊第一欄是以 8 進位來表示bytes數。以上面範例來說,第二欄0000020代表開頭是
# 第 16 個 byes (2x8) 的內容之意。

範例二:請將/etc/issue這個文件的內容以8進位列出儲存值與ASCII的對照表
[root@www ~]# od -t oCc /etc/issue
0000000 103 145 156 164 117 123 040 162 145 154 145 141 163 145 040 065
          C   e   n   t   O   S       r   e   l   e   a   s   e       5
0000020 056 062 040 050 106 151 156 141 154 051 012 113 145 162 156 145
          .   2       (   F   i   n   a   l   )  \n   K   e   r   n   e
0000040 154 040 134 162 040 157 156 040 141 156 040 134 155 012 012
          l       \   r       o   n       a   n       \   m  \n  \n
0000057
# 如上所示,可以發現每個字節可以對應到的數值爲何!
# 例如e對應的記錄數值爲145,轉成十進位:1x8^2+4x8+5=101。

利用這個命令,可以將 data file 或者是 binary file 的內容數據給他讀出來喔! 雖然讀出的來數值默認是使用非文字檔,亦即是 16 進位的數值來顯示的, 不過,我們還是可以透過 -t c 的選項與參數來將數據內的字節以 ASCII 類型的字節來顯示, 雖然對於一般使用者來說,這個命令的用處可能不大,但是對於工程師來說, 這個命令可以將 binary file 的內容作一個大致的輸出,他們可以看得出東西的啦~ _

如果對純文字檔使用這個命令,你甚至可以發現到 ASCII 與字節的對照表!非常有趣! 例如上述的範例二,你可以發現到每個英文字 e 對照到的數字都是 145,轉成十進位你就能夠發現那是 101 羅! 如果你有任何程序語言的書,拿出來對照一下 ASCII 的對照表,就能夠發現真是正確啊!

5 修改文件時間與創建新文檔touch

我們在 ls 這個命令的介紹時,有稍微提到每個文件在linux底下都會記錄許多的時間參數, 其實是有三個主要的變動時間,那麼三個時間的意義是什麼呢?

  • modification time (mtime):
    當該文件的『內容數據』變更時,就會升級這個時間!內容數據指的是文件的內容,而不是文件的屬性或權限喔!

  • status time (ctime):
    當該文件的『狀態 (status)』改變時,就會升級這個時間,舉例來說,像是權限與屬性被更改了,都會升級這個時間啊。

  • access time (atime):
    當『該文件的內容被取用』時,就會升級這個讀取時間 (access)。舉例來說,我們使用 cat 去讀取 /etc/man.config , 就會升級該文件的 atime 了。

這是個挺有趣的現象,舉例來說,我們來看一看你自己的 /etc/man.config 這個文件的時間吧!
看到了嗎?在默認的情況下,ls 顯示出來的是該文件的 mtime ,也就是這個文件的內容上次被更動的時間。 至於鳥哥的系統是在 9 月 4 號的時候安裝的,因此,這個文件被產生導致狀態被更動的時間就回溯到那個時間點了(ctime)! 而還記得剛剛我們使用的範例當中,有使用到man.config這個文件啊,所以啊,他的 atime 就會變成剛剛使用的時間了!

文件的時間是很重要的,因爲,如果文件的時間誤判的話,可能會造成某些程序無法順利的運行。 OK!那麼萬一我發現了一個文件來自未來,該如何讓該文件的時間變成『現在』的時刻呢? 很簡單啊!就用『touch』這個命令即可!


[root@www ~]# touch [-acdmt] 文件
選項與參數:
-a  :僅修訂 access time;
-c  :僅修改文件的時間,若該文件不存在則不創建新文件;
-d  :後面可以接欲修訂的日期而不用目前的日期,也可以使用 --date="日期或時間"
-m  :僅修改 mtime ;
-t  :後面可以接欲修訂的時間而不用目前的時間,格式爲[YYMMDDhhmm]

範例一:新建一個空的文件並觀察時間
[root@www ~]# cd /tmp
[root@www tmp]# touch testtouch
[root@www tmp]# ls -l testtouch
-rw-r--r-- 1 root root 0 Sep 25 21:09 testtouch
# 注意到,這個文件的大小是 0 呢!在默認的狀態下,如果 touch 後面有接文件,
# 則該文件的三個時間 (atime/ctime/mtime) 都會升級爲目前的時間。若該文件不存在,
# 則會主動的創建一個新的空的文件喔!例如上面這個例子!

範例二:將 ~/.bashrc 複製成爲 bashrc,假設複製完全的屬性,檢查其日期
[root@www tmp]# cp -a ~/.bashrc bashrc
[root@www tmp]# ll bashrc; ll --time=atime bashrc; ll --time=ctime bashrc
-rw-r--r-- 1 root root 176 Jan  6  2007 bashrc  <==這是 mtime
-rw-r--r-- 1 root root 176 Sep 25 21:11 bashrc  <==這是 atime
-rw-r--r-- 1 root root 176 Sep 25 21:12 bashrc  <==這是 ctime

在上面這個案例當中我們使用了『ll』這個命令(兩個英文L的小寫),這個命令其實就是『ls -l』的意思, ll本身不存在,是被『做出來』的一個命令別名。相關的命令別名我們會在bash章節當中詳談的,這裏先知道ll="ls -l"即可。 至於分號『 ; 』則代表連續命令的下達啦!你可以在一行命令當中寫入多重命令, 這些命令可以『依序』運行。由上面的命令我們會知道ll那一行有三個命令被下達在同一行中。

至於運行的結果當中,我們可以發現數據的內容與屬性是被複制過來的,因此文件內容時間(mtime)與原本文件相同。 但是由於這個文件是剛剛被創建的,因此狀態(ctime)與讀取時間就便呈現在的時間啦! 那如果你想要變更這個文件的時間呢?可以這樣做:

範例三:修改案例二的 bashrc 文件,將日期調整爲兩天前
[root@www tmp]# touch -d "2 days ago" bashrc
[root@www tmp]# ll bashrc; ll --time=atime bashrc; ll --time=ctime bashrc
-rw-r--r-- 1 root root 176 Sep 23 21:23 bashrc
-rw-r--r-- 1 root root 176 Sep 23 21:23 bashrc
-rw-r--r-- 1 root root 176 Sep 25 21:23 bashrc
# 跟上個範例比較看看,本來是 25 日的變成了 23 日了 (atime/mtime)~
# 不過, ctime 並沒有跟著改變喔!

範例四:將上個範例的 bashrc 日期改爲 2007/09/15 2:02
[root@www tmp]# touch -t 0709150202 bashrc
[root@www tmp]# ll bashrc; ll --time=atime bashrc; ll --time=ctime bashrc
-rw-r--r-- 1 root root 176 Sep 15  2007 bashrc
-rw-r--r-- 1 root root 176 Sep 15  2007 bashrc
-rw-r--r-- 1 root root 176 Sep 25 21:25 bashrc
# 注意看看,日期在 atime 與 mtime 都改變了,但是 ctime 則是記錄目前的時間!

透過 touch 這個命令,我們可以輕易的修訂文件的日期與時間。並且也可以創建一個空的文件喔! 不過,要注意的是,即使我們複製一個文件時,複製所有的屬性,但也沒有辦法複製 ctime 這個屬性的。 ctime 可以記錄這個文件最近的狀態 (status) 被改變的時間。無論如何,還是要告知大家, 我們平時看的文件屬性中,比較重要的還是屬於那個 mtime 啊!我們關心的常常是這個文件的『內容』 是什麼時候被更動的說~了乎?

無論如何, touch 這個命令最常被使用的情況是:

  • 創建一個空的文件;
  • 將某個文件日期修訂爲目前 (mtime 與 atime)

摘自:鳥哥的Linux私房菜第七章、Linux 文件與目錄管理

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章