原创 linux 前臺後臺運行job管理

1, 查jobs: hadoop11:/usr/lib/hive # jobs [1]+  Running                 nohup hive --service hiveserver -p 10000 &  (wd:

原创 mapreduce在倒排索引中練習

倒排索引是文件檢索系統中常用的數據結構,被廣泛應用於全文章搜索引擎。 通常情況下,倒排索引由一個單詞或詞組以及相關的文檔列表組成,文檔列表中的文檔或者是標識文檔的ID號,或者是指定文檔所在位置的URI; 在實際應用中,往往還需要給每個文檔

原创 dd與cp的區別

轉載自網絡 問: 看了一些關於dd和cp的命令,但是我始終無法明白dd和cp之間有什麼不同? 不是都可以看成是備份的作用麼?還有什麼區別呢? 答: 1、dd是對塊進行操作的,cp是對文件操作的。 2、比如有兩塊硬盤,要將第一個硬盤裏的

原创 python:刪除文件中包含關鍵詞的行

re.compile(),正則表達式在模式匹配前進行預編譯;使用預編譯代碼比字符串快; test.txt中包含以下文字: 1:li 2:test 3:num 在運行完程序,生成的target.txt中,內容爲 1:li 3:num 代碼