1、lsof 簡介
lsof 是 Linux 下的一個非常實用的系統級的監控、診斷工具。
它的意思是 List Open Files,很容易你就記住了它是 “ls + of”的組合~
它可以用來列出被各種進程打開的文件信息,記住:linux 下 “一切皆文件”,
包括但不限於 pipes, sockets, directories, devices, 等等。
因此,使用 lsof,你可以獲取任何被打開文件的各種信息。
只需輸入 lsof 就可以生成大量的信息,因爲 lsof 需要訪問核心內存和各種文件,所以必須以 root 用戶的身份運行它才能夠充分地發揮其功能。
lsof 的示例輸出:
2、lsof 常用用法
2.1 監控打開的文件、設備
查看文件、設備被哪些進程佔用
2.2 監控文件系統
指定目錄、掛載點,可以看到有哪些進程打開了其下的文件:
這在 umount 某個文件系統失敗時非常有用(通常會報該 FS is busy)。
列出某個目錄(掛載點 如 /home 也行)下被打開的文件:
列出被指定進程名打開的文件:
2.3 監控進程
指定進程號,可以查看該進程打開的文件:
當你想要殺掉某個用戶所有打開的文件、設備,你可以這樣:
此處 -t 的作用是單獨的列出 進程 id 這一列。
關於殺死進程的 4 種方式,請參考:
http://www.thegeekstuff.com/2009/12/4-ways-to-kill-a-process-kill-killall-pkill-xkill/
2.4 監控網絡
查看指定端口有哪些進程在使用(lsof -i 列出所有的打開的網絡連接):
列出被某個進程打開所有的網絡文件:
或者
列出所有 tcp、udp 連接:
列出所有 NFS 文件:
查看指定網口有哪些進程在使用:
3、更多使用技巧
3.1 監控用戶
查看指定用戶打開的文件(lsof -u ^lakshmanan 可以排除某用戶):
3.2 監控應用程序
查看指定程序打開的文件:
4、命令模式技巧
4.1 組合邏輯查詢條件
只有多個查詢條件都滿足, 用 "-a" 參數,默認是 -o 。
4.2 lsof 命令的重複執行模式:
基於給定的參數延時多少秒重複執行 lsof
+r 表示 當沒有文件被打開的時候,repeat mode 將自行結束。
-r 表示 不管文件是否存在或者被打開,它都將執行,直到你中斷它。
每個循環的輸出使用 ‘=======’ 做分隔符,你也可以用 ‘-r’ | ‘+r’ 指定延時時間。
以上輸出是前 5 秒沒有輸出,然後 “inita.sh” 啓動後,開始有了輸出。
5、最後的技巧
關於磁盤空間告警 df -h --max=1 與 du -hx --max=1 顯示不一致的問題,
最常見的的還是下面這種情況:
lsof|grep -i delete
看看被刪除的文件:有些刪了文件,但是進程沒 reload,那些空間還是佔用的,你可以理解爲類似 windows 下的進程句柄沒釋放的概念吧~ 只是 windows 下如果有文件被進程使用,你一般是刪不掉的,而 linux 雖然不做刪除限制,但卻要等到進程使用完文件才能完全釋放,以防止進程奔潰,這是操作系統對資源的管理差異吧~
例如 nginx 會有很多臨時文件佔用了 /tmp 目錄,刪掉後,依然佔用着空間,
此時你可以:
pkill -9 nginx && /etc/init.d/nginx restart
好吧,本文到此結束了,關於 lsof 還有很多很多,不過哥常用、知道的就這些了,哥也只能幫你到這兒了,
如果你還需要其它的內容,請自行 google 吧,騷年。。。
6、refer:
使用 lsof 查找打開的文件
http://www.ibm.com/developerworks/cn/aix/library/au-lsof.html
15 Linux lsof Command Examples (Identify Open Files)
http://www.thegeekstuff.com/2012/08/lsof-command-examples/
實用的系統工具之 lsof
http://www.ylinux.org/forum/t/276