如何在Linux上提高文本的搜索效率

如何在Linux上提高文本的搜索效率


ack_ampliado

對於系統管理員或程序員來說,當需要在複雜配置的目錄中或者在大型源碼樹中搜尋特定的文本或模式時,grep類型的工具大概是最受歡迎的。

如果grep是你最喜歡的工具之一,那麼你可能會更喜歡ack。ack是一個基於Perl的類似於grep的命令行工具,但是搜索速度更快,能力比grep更強。尤其是當你是程序員時,我強烈推薦你使用ack來取代grep。

ack的用法非常適用與代碼搜索,因此程序員可以在源碼樹中進行復雜的查詢,而只需要更少的按鍵。

ack的特性

ack的一些非常強大的特性:

  • 默認搜索當前工作目錄
  • 默認遞歸搜索子目錄
  • 忽略元數據目錄,比如.svn,.git,CSV等目錄
  • 忽略二進制文件(比如pdf,image,coredumps)和備份文件(比如foo~,*.swp)
  • 在搜索結果中打印行號,有助於找到目標代碼
  • 能搜索特定文件類型(比如Perl,C++,Makefile),該文件類型可以有多種文件後綴
  • 高亮搜索結果
  • 支持Perl的高級正則表達式,比grep所使用GNU正則表達式更有表現力。

相比於搜索速度,ack總體上比grep更快。ack的速度只要表現在它的內置的文件類型過濾器。在搜索過程中,ack維持着認可的文件類型的列表,同時跳過未知或不必要的文件類型。它同樣避免檢查多餘的元數據目錄。

在Linux上安裝ack

儘管在大多數Linux發行版中是ack是標準包,可輕易獲得(比如在基於debian的系統中,是ack-grep包,而在基於Redhat的系統中則是ack包),但是與發行版捆綁的ack版本仍然是1.x,而ack2.0已經發布,而且擁有更多特性。

因此我準備在官方網站下載,然後安裝ack。

方便的是,ack在官網可可作爲一個單獨的Perl腳本獲得,其中整合了所有需要依賴的模塊。因此,你不需要額外安裝Perl模塊來運行這腳本。

爲了在你的Linux系統中安裝ack,去官網下載最新版本的ack。在寫本文時,最新的版本是2.12

需要注意的是,在基於Debian的系統中,有一個獨立的包也叫ack(漢碼轉換器)。所以如果你碰巧有使用那個包,那麼你就必須重命名ack來避免命名衝突了。

ack的使用案例

1.在當前目錄遞歸搜索單詞”eat”,不匹配類似於”feature”或”eating”的字符串:

2.搜索有特殊字符的字符串’$path=.’,所有的元字符(比如’$',’.')需要在字面上被匹配:

3.除了dowloads目錄,在所有目錄搜索”about”單詞:

4.只搜索包含’protected’單詞的PHP文件,然後通過文件名把搜索結果整合在一起,打印每個文件對應的搜索結果:

ack_1

5.獲取包含’CFLAG’關鍵字的Makefile的文件名。文件名爲*.mk,makefile,Makefile,GNUmakefile的都在考慮範圍內:

6.顯示整個日誌文件時高亮匹配到的字符串:

7.要換取ack支持的文件過濾類型,運行:

ack_2



原文鏈接: Xmodulo 翻譯: 極客範 - minejo

譯文鏈接: http://www.geekfan.net/6881/

[ 轉載請保留原文出處、譯者和譯文鏈接。]
發佈了16 篇原創文章 · 獲贊 9 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章