Linux下刪除文件爲何空間不釋放

爲什麼刪除文件後磁盤空間還是不變

 

linux刪除文件後沒有釋放空間

 

今天發現一臺服務器的home空間滿了,於是要清空無用的文件,當我刪除文件後,發現可用空間沒有變化

 

os:centos4.7

 

現象:

 

發現當前磁盤空間使用情況:

 

[root@ticketb ~]# df -h

Filesystem            Size  Used Avail Use% Mounted on

/dev/sda1             981M  203M  729M  22% /

none                   16G     0   16G   0% /dev/shm

/dev/sda9             2.9G   37M  2.7G   2% /tmp

/dev/sda7             4.9G  1.9G  2.7G  42% /usr

/dev/sda8             2.9G  145M  2.6G   6% /var

/dev/mapper/vghome-lvhome

                       20G   19G   11M 100% /home

/dev/mapper/vgoradata-lvoradata

                      144G   48G   90G  35% /u01/oradata

/dev/mapper/vgbackup-lvbackup

                      193G  7.8G  175G   5% /u01/backup

 

 

通過下面的命令找到無用的文件,然後刪除

 

 

[root@ticketb ~]# find /home/oracle/admin/dbticb/udump/ -name "dbticb_*.trc" -mtime +50 | xargs rm -rf

 

然後在查看磁盤空間使用情況,發現沒有/home空間沒有變化

 

[root@ticketb ~]# df -h

Filesystem            Size  Used Avail Use% Mounted on

/dev/sda1             981M  203M  729M  22% /

none                   16G     0   16G   0% /dev/shm

/dev/sda9             2.9G   37M  2.7G   2% /tmp

/dev/sda7             4.9G  1.9G  2.7G  42% /usr

/dev/sda8             2.9G  145M  2.6G   6% /var

/dev/mapper/vghome-lvhome

                       20G   19G   11M 100% /home

/dev/mapper/vgoradata-lvoradata

                      144G   48G   90G  35% /u01/oradata

/dev/mapper/vgbackup-lvbackup

                      193G  7.8G  175G   5% /u01/backup

 

這個鬱悶啊,明明刪除文件了,怎麼空間沒有被釋放啊,rm命令應該是直接刪除啊,在查看下/home下還有什麼佔用空間

 

[root@ticketb ~]# du -h --max-depth=1  /home

16K     /home/lost+found

2.6G    /home/oracle

2.6G    /home

 

可這裏顯示空間已經釋放了啊,於是google下,

 

未釋放磁盤空間原因:

 

在Linux或者Unix系統中,通過rm或者文件管理器刪除文件將會從文件系統的目錄結構上解除鏈接(unlink).然而如果文件是被

打開的(有一個進程正在使用),那麼進程將仍然可以讀取該文件,磁盤空間也一直被佔用。而我刪除的是oracle的告警log文件

刪除的時候文件應該正在被使用

 

解決方法

 

首先獲得一個已經被刪除但是仍然被應用程序佔用的文件列表,如下所示:

 

 

[root@ticketb ~]# lsof |grep deleted

oracle    12639  oracle    5w      REG              253,0         648     215907 /home/oracle/admin/dbticb/udump/dbticb_ora_12637.trc (deleted)

oracle    12639  oracle    6w      REG              253,0 16749822091     215748 /home/oracle/admin/dbticb/bdump/alert_dbticb.log (deleted)

oracle    12639  oracle    7u      REG              253,0           0      36282 /home/oracle/oracle/product/10.2.0/db_1/dbs/lkinstdbticb (deleted)

oracle    12639  oracle    8w      REG              253,0 16749822091     215748 /home/oracle/admin/dbticb/bdump/alert_dbticb.log (deleted)

oracle    12641  oracle    5w      REG              253,0         648     215907 /home/oracle/admin/dbticb/udump/dbticb_ora_12637.trc (deleted)

oracle    12641  oracle    6w      REG              253,0 16749822091     215748 /home/oracle/admin/dbticb/bdump/alert_dbticb.log (deleted)

oracle    23492  oracle    6w      REG              253,0 16749822091     215748 /home/oracle/admin/dbticb/bdump/alert_dbticb.log (deleted)

oracle    23492  oracle    7u      REG              253,0           0      36282 /home/oracle/oracle/product/10.2.0/db_1/dbs/lkinstdbticb (deleted)

oracle    23492  oracle    8w      REG              253,0 16749822091     215748 /home/oracle/admin/dbticb/bdump/alert_dbticb.log (deleted)

oracle    23494  oracle   10u      REG              253,0           0      36307 /home/oracle/oracle/product/10.2.0/db_1/dbs/lkinstrmandb (deleted)

 

 

 

從輸出結果可以看到/home/oracle/admin/dbticb/bdump/alert_dbticb.log還被使用,未被釋放空間

 

如何讓進程釋放呢?

 

一種方法是kill掉相應的進程,或者停掉使用這個文件的應用,讓os自動回收磁盤空間

我這個環境有很多進程在使用的這個文件,停掉進程有點麻煩,再有就是風險很大

 

當linux打開一個文件的時候,Linux內核會爲每一個進程在/proc/ 『/proc/nnnn/fd/目錄(nnnn爲pid)』建立一個以其pid

爲名的目錄用來保存進程的相關信息,而其子目錄fd保存的是該進程打開的所有文件的fd(fd:file descriptor)。

kill進程是通過截斷proc文件系統中的文件可以強制要求系統回收分配給正在使用的的文件。

這是一項高級技術,僅到管理員確定不會對運行中的進程造成影響時使用。應用程序對這種方

式支持的並不好,當一個正在使用的文件被截斷可能會引發不可預知的問題

 

 

例如,根據之前lsof的輸出:

1.$ file /proc/25575/fd/33

2./proc/25575/fd/33: broken symbolic link to `/oradata/DATAPRE/UNDOTBS009.dbf (deleted)'

3.$ echo > /proc/25575/fd/33

 

 

 

所以我還是採用停應用來解決

 

restart oracle數據庫,發現/home/oracle/admin/dbticb/bdump/alert_dbticb.log對應的空間被釋放

 

在查看磁盤空間的使用情況,發現空間已經回收了

 

 

[root@ticketb ~]# df -h

Filesystem            Size  Used Avail Use% Mounted on

/dev/sda1             981M  203M  729M  22% /

none                   16G     0   16G   0% /dev/shm

/dev/sda9             2.9G   37M  2.7G   2% /tmp

/dev/sda7             4.9G  1.9G  2.7G  42% /usr

/dev/sda8             2.9G  145M  2.6G   6% /var

/dev/mapper/vghome-lvhome

                       20G  2.6G   16G  15% /home

/dev/mapper/vgoradata-lvoradata

                      144G   48G   90G  35% /u01/oradata

/dev/mapper/vgbackup-lvbackup

                      193G  7.8G  175G   5% /u01/backup

 

 

ok,問題解決,然後做下收尾工作即可

 

-------------------------------------------------------------------------------------------------

 

學習下lsof命令

 

lsof全名list opened files,也就是列舉系統中已經被打開的文件。我們都知道,linux環境中,任何事物都是文件,

設備是文件,目錄是文件,甚至sockets也是文件。所以,用好lsof命令,對日常的linux管理非常有幫助。

 

lsof是linux最常用的命令之一,通常的輸出格式爲:

 

引用

COMMAND     PID   USER   FD      TYPE     DEVICE     SIZE       NODE NAME

 

常見包括如下幾個字段:更多的可見manual。

1、COMMAND

默認以9個字符長度顯示的命令名稱。可使用+c參數指定顯示的寬度,若+c後跟的參數爲零,則顯示命令的全名

2、PID:進程的ID號

3、PPID

父進程的IP號,默認不顯示,當使用-R參數可打開。

4、PGID

進程組的ID編號,默認也不會顯示,當使用-g參數時可打開。

5、USER

命令的執行UID或系統中登陸的用戶名稱。默認顯示爲用戶名,當使用-l參數時,可顯示UID。

6、FD

是文件的File Descriptor number,或者如下的內容:

(這裏很難翻譯對應的意思,保留英文)

 

引用

cwd  current working directory;

Lnn  library references (AIX);

jld  jail directory (FreeBSD);

ltx  shared library text (code and data);

Mxx  hex memory-mapped type number xx.

m86  DOS Merge mapped file;

mem  memory-mapped file;

mmap memory-mapped device;

pd   parent directory;

rtd  root directory;

tr   kernel trace file (OpenBSD);

txt  program text (code and data);

v86  VP/ix mapped file;

 

 

文件的File Descriptor number顯示模式有:

 

引用

r for read access;

w for write access;

u for read and write access;

N for a Solaris NFS lock of unknown type;

r for read lock on part of the file;

R for a read lock on the entire file;

w for a write lock on part of the file;

W for a write lock on the entire file;

u for a read and write lock of any length;

U for a lock of unknown type;

x for an SCO OpenServer Xenix lock on part  of the file;

X  for an SCO OpenServer Xenix lock on the entire file;

space if there is no lock.

 

 

7、TYPE

引用

IPv4 IPv4的包;

IPv6 使用IPv6格式的包,即使地址是IPv4的,也會顯示爲IPv6,而映射到IPv6的地址;

DIR 目錄

LINK 鏈接文件

詳情請看manual中更多的註釋。

 

8、DEVICE

使用character special、block special表示的設備號

9、SIZE

文件的大小,如果不能用大小表示的,會留空。使用-s參數控制。

10、NODE

本地文件的node碼,或者協議,如TCP等

11、NAME

掛載點和文件的全路徑(鏈接會被解析爲實際路徑),或者連接雙方的地址和端口、狀態等

 

常用示例:

 

1.顯示開啓文件/home/oracle/10.2.0/db_1/bin/tnslsnr的進程

 

[root@svr-db-test ~]# lsof /home/oracle/10.2.0/db_1/bin/tnslsnr

COMMAND  PID   USER  FD   TYPE DEVICE   SIZE     NODE NAME

tnslsnr 3520 oracle txt    REG  253,5 431062 11408866 /home/oracle/10.2.0/db_1/bin/tnslsnr

 

2.知道22端口現在運行什麼程序

 

[root@svr-db-test ~]# lsof -i :22

COMMAND  PID USER   FD   TYPE  DEVICE SIZE NODE NAME

sshd    3101 root    3u  IPv6    8670       TCP *:ssh (LISTEN)

sshd    4545 root    3u  IPv6 4237972       TCP 203.aibo.com:ssh->win-avbmq9e8ka7.gdgg.local:nsjtp-ctrl (ESTABLISHED)

 

3.顯示init進程現在打開的文件

 

[root@svr-db-test ~]# lsof -c init

COMMAND PID USER   FD   TYPE DEVICE    SIZE   NODE NAME

init      1 root  cwd    DIR  253,0    4096      2 /

init      1 root  rtd    DIR  253,0    4096      2 /

init      1 root  txt    REG  253,0   43496 524446 /sbin/init

init      1 root  mem    REG  253,0  130448 917826 /lib64/ld-2.5.so

init      1 root  mem    REG  253,0 1678480 917827 /lib64/libc-2.5.so

init      1 root  mem    REG  253,0   23520 917686 /lib64/libdl-2.5.so

init      1 root  mem    REG  253,0  247528 917844 /lib64/libsepol.so.1

init      1 root  mem    REG  253,0   95480 917845 /lib64/libselinux.so.1

init      1 root   10u  FIFO   0,16           2311 /dev/initctl

 

4. 看進程號爲1的進程打開了哪些文件

 

[root@svr-db-test ~]# lsof -p 1

COMMAND PID USER   FD   TYPE DEVICE    SIZE   NODE NAME

init      1 root  cwd    DIR  253,0    4096      2 /

init      1 root  rtd    DIR  253,0    4096      2 /

init      1 root  txt    REG  253,0   43496 524446 /sbin/init

init      1 root  mem    REG  253,0  130448 917826 /lib64/ld-2.5.so

init      1 root  mem    REG  253,0 1678480 917827 /lib64/libc-2.5.so

init      1 root  mem    REG  253,0   23520 917686 /lib64/libdl-2.5.so

init      1 root  mem    REG  253,0  247528 917844 /lib64/libsepol.so.1

init      1 root  mem    REG  253,0   95480 917845 /lib64/libselinux.so.1

init      1 root   10u  FIFO   0,16           2311 /dev/initctl

 

5. 顯示歸屬3520的進程情況

 

[root@svr-db-test ~]# lsof -g 3520

COMMAND  PID PGID   USER   FD   TYPE             DEVICE      SIZE     NODE NAME

tnslsnr 3520 3520 oracle  cwd    DIR              253,5      4096 11059201 /home/oracle

tnslsnr 3520 3520 oracle  rtd    DIR              253,0      4096        2 /

tnslsnr 3520 3520 oracle  txt    REG              253,5    431062 11408866 /home/oracle/10.2.0/db_1/bin/tnslsnr

tnslsnr 3520 3520 oracle  mem    REG              253,0    130448   917826 /lib64/ld-2.5.so

tnslsnr 3520 3520 oracle  mem    REG              253,0   1678480   917827 /lib64/libc-2.5.so

tnslsnr 3520 3520 oracle  mem    REG              253,0     23520   917686 /lib64/libdl-2.5.so

tnslsnr 3520 3520 oracle  mem    REG              253,0    615136   917834 /lib64/libm-2.5.so

tnslsnr 3520 3520 oracle  mem    REG              253,0    141208   917829 /lib64/libpthread-2.5.so

tnslsnr 3520 3520 oracle  mem    REG              253,0    109824   917839 /lib64/libnsl-2.5.so

tnslsnr 3520 3520 oracle  mem    REG              253,5  20706622 11405436 /home/oracle/10.2.0/db_1/lib/libclntsh.so.10.1

tnslsnr 3520 3520 oracle  mem    REG              253,5   3803097 11410641 /home/oracle/10.2.0/db_1/lib/libnnz10.so

tnslsnr 3520 3520 oracle  mem    REG              253,5     83493 11407251 /home/oracle/10.2.0/db_1/lib/libons.so

tnslsnr 3520 3520 oracle  mem    REG              253,0     53880   917532 /lib64/libnss_files-2.5.so

tnslsnr 3520 3520 oracle  mem    REG              253,5      8545 11407615 /home/oracle/10.2.0/db_1/lib/libskgxn2.so

tnslsnr 3520 3520 oracle  mem    REG              253,5    513705 11410332 /home/oracle/10.2.0/db_1/lib/libocrutl10.so

tnslsnr 3520 3520 oracle  mem    REG              253,5    636161 11410330 /home/oracle/10.2.0/db_1/lib/libocr10.so

tnslsnr 3520 3520 oracle  mem    REG              253,5    657825 11410331 /home/oracle/10.2.0/db_1/lib/libocrb10.so

tnslsnr 3520 3520 oracle  mem    REG              253,5   1745769 11410365 /home/oracle/10.2.0/db_1/lib/libhasgen10.so

tnslsnr 3520 3520 oracle  mem    REG              253,5     61985 11410366 /home/oracle/10.2.0/db_1/lib/libclsra10.so

tnslsnr 3520 3520 oracle    0u   CHR                1,3               2553 /dev/null

tnslsnr 3520 3520 oracle    1u   CHR                1,3               2553 /dev/null

tnslsnr 3520 3520 oracle    2u   CHR                1,3               2553 /dev/null

tnslsnr 3520 3520 oracle    3w   REG              253,5 318853012 11633459 /home/oracle/10.2.0/db_1/network/log/listener.log

tnslsnr 3520 3520 oracle    4r  FIFO                0,6              15661 pipe

tnslsnr 3520 3520 oracle    5r   REG              253,5     11776 11410579 /home/oracle/10.2.0/db_1/network/mesg/nlus.msb

tnslsnr 3520 3520 oracle    6r   REG              253,5     46592 11407160 /home/oracle/10.2.0/db_1/network/mesg/tnsus.msb

tnslsnr 3520 3520 oracle    7w  FIFO                0,6              15662 pipe

tnslsnr 3520 3520 oracle    8u  IPv4              15665                TCP 203.aibo.com:ncube-lm (LISTEN)

tnslsnr 3520 3520 oracle    9u  unix 0xffff81021b7d6980              15666 /var/tmp/.oracle/s#3520.1

tnslsnr 3520 3520 oracle   10u  unix 0xffff81021b7d66c0              15668 /var/tmp/.oracle/s#3520.2

 

 

6.依照文件夾/home/oracle來搜尋,但不會打開子目錄,用來顯示目錄下被進程開啓的文件

 

[root@svr-db-test ~]# lsof +d /home/oracle

COMMAND  PID   USER   FD   TYPE DEVICE SIZE     NODE NAME

tnslsnr 3520 oracle  cwd    DIR  253,5 4096 11059201 /home/oracle

 

7. 打開/home/oracle文件夾以及其子目錄搜尋,用來顯示目錄下被進程開啓的文件

 

[root@svr-db-test ~]# lsof +D /home/oracle

 

 

顯示內容太多了,不顯示了

 

 

8. lsof -i 用以顯示符合條件的進程情況

 

語法: lsof -i[46] [protocol][@hostname|hostaddr][:service|port]

 

46 --> IPv4 or IPv6

protocol --> TCP or UDP

hostname --> Internet host name

hostaddr --> IPv4位置

service --> /etc/service中的 service name (可以不只一個)

port --> 端口號 (可以不只一個)

 

例:

 

 

[root@svr-db-test ~]# lsof -i [email protected]:1521 -n

COMMAND   PID   USER   FD   TYPE  DEVICE SIZE NODE NAME

oracle  15633 oracle   16u  IPv4 4069605       TCP 192.168.2.203:31580->192.168.2.245:ncube-lm (ESTABLISHED)

 

 

[root@svr-db-test ~]# lsof -i [email protected]:1521 

COMMAND   PID   USER   FD   TYPE  DEVICE SIZE NODE NAME

oracle  15633 oracle   16u  IPv4 4069605       TCP 203.aibo.com:31580->192.168.2.245:ncube-lm (ESTABLISHED)

 

lsof -n 不將IP轉換爲hostname,缺省是不加上-n參數

 

9. 顯示某用戶的已經打開的文件(或該用戶執行程序已經打開的文件)

 

[root@svr-db-test ~]# lsof -u oracle

[root@svr-db-test ~]# lsof -u 0

 

 

10. 僅打印進程,方便shell腳本調用

[root@svr-db-test ~]# lsof -tc sshd

3101

4545

 

 

關注:

 

進程調試命令:truss、strace和ltrace

 

進程無法啓動,軟件運行速度突然變慢,程序的"SegmentFault"等等都是讓每個Unix系統用戶頭痛的問題,而這些問題都可以通過使用truss、strace和ltrace這三個常用的調試工具來快速診斷軟件的"疑難雜症"。

 -----end-----

 

問題

文件被刪除後,空間沒有被釋放

原因

在Linux或者Unix系統中,通過rm或者文件管理器刪除文件將會從文件系統的目錄結構上解除鏈接(unlink).然而如果文件是被打開的(有一個進程正在使用),那麼進程將仍然可以讀取該文件,磁盤空間也一直被佔用。

 

解決方法

 

首先我們獲得一個已經被刪除但是仍然被應用程序佔用的文件列表:

 

$ /usr/sbin/lsof|grep deleted

ora    25575 data   33u      REG              65,65  4294983680   31014933 /oradata/DATAPRE/UNDOTBS009.dbf (deleted)

從lsof的輸出中,我們可以發現pid爲25575的進程持有着以文件描述號(fd)爲33打開的文件/oradata/DATAPRE/UNDOTBS009.dbf。

 

在我們找到了這個文件之後可以通過結束進程的方式來釋放被佔用的空間。

通過截斷proc文件系統中的文件可以強制要求系統回收分配給正在使用的的文件。這是一項高級技術,僅到管理員確定不會對運行中的進程造成影響時使用。應用程序對這種方式支持的並不好,當一個正在使用的文件被截斷可能會引發不可預知的問題

$ echo > /proc/pid/fd/fd_number

例如,根據之前lsof的輸出:

$ file /proc/25575/fd/33

/proc/25575/fd/33: broken symbolic link to `/oradata/DATAPRE/UNDOTBS009.dbf (deleted)’

$ echo > /proc/25575/fd/33

發佈了211 篇原創文章 · 獲贊 1 · 訪問量 1萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章