Linux基礎入門(七) --學習筆記-數據提取

挑戰:數據提取

數據提取
介紹

小明在做數據分析的時候需要提取文件中關於數字的部分,同時還要提取用戶的郵箱部分,但是有的行不是數組也不是郵箱,現在需要你在data2這個文件中幫助他用正則表達式匹配出數字部分和郵箱部分。在這裏下載這裏寫代碼片

wget http://labfile.oss.aliyuncs.com/courses/1/data2

將下載的data2保存在/home/shiyanlou/data2
目標

在文件data中匹配數字開頭的行,結果寫入/home/shiyanlou/num文件
在文件data中匹配出正確格式的郵箱,結果寫入一個名爲/home/shiyanlou/mail的文件

提示

郵箱的格式
注意符號.的處理

匹配數字開頭的行

grep '^[[:digit:]].' data2>num

匹配正確格式的郵箱

grep '^[[:alnum:]]*@[[:alnum:]]*\.[[:alnum:]]*' data2>mail

總體上非常簡單. 也可用 [0-9] 來代替 [[:digit:]]
[a-zA-Z] 代替 [[:alpha:]]
郵箱的 ‘. ’ 需要加 ‘\’ 轉義.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章