挑戰:數據提取
數據提取
介紹
小明在做數據分析的時候需要提取文件中關於數字的部分,同時還要提取用戶的郵箱部分,但是有的行不是數組也不是郵箱,現在需要你在data2這個文件中幫助他用正則表達式匹配出數字部分和郵箱部分。在這裏下載這裏寫代碼片
wget http://labfile.oss.aliyuncs.com/courses/1/data2
將下載的data2保存在/home/shiyanlou/data2
目標
在文件data中匹配數字開頭的行,結果寫入/home/shiyanlou/num文件
在文件data中匹配出正確格式的郵箱,結果寫入一個名爲/home/shiyanlou/mail的文件
提示
郵箱的格式
注意符號.的處理
匹配數字開頭的行
grep '^[[:digit:]].' data2>num
匹配正確格式的郵箱
grep '^[[:alnum:]]*@[[:alnum:]]*\.[[:alnum:]]*' data2>mail
總體上非常簡單. 也可用 [0-9] 來代替 [[:digit:]]
[a-zA-Z] 代替 [[:alpha:]]
郵箱的 ‘. ’ 需要加 ‘\’ 轉義.