使用linux命令或者shell實現:文件words存放英文單詞,格式爲每行一個英文單詞(單詞可以重複),統計這個文件中出現次數最多的前10個單詞。
cat words.txt | sort | uniq -c | sort -k1,1nr | head -10
主要考察對sort、uniq命令的使用,相關解釋如下,命令及參數的詳細說明請自行通過man查看,簡單介紹下以上指令各部分的功能:
sort: 對單詞進行排序
uniq -c: 顯示唯一的行,並在每行行首加上本行在文件中出現的次數
sort -k1,1nr: 按照第一個字段,數值排序,且爲逆序
head -10: 取前10行數據
轉載自新浪博客 http://blog.sina.com.cn/fairy16741