Linux硬鏈接與軟連接實現對比

概述

linux系統中有一種比較特殊的文件稱之爲鏈接(link)。通俗地說,鏈接就是從一個文件指向另外一個文件的路徑。linux中鏈接分爲倆種,硬鏈接和軟鏈接。簡單來說,硬鏈接相當於源文件和鏈接文件在磁盤和內存中共享一個inode,因此,鏈接文件和源文件有不同的dentry,因此,這個特性決定了硬鏈接無法跨越文件系統,而且我們無法爲目錄創建硬鏈接。軟鏈接和硬鏈接不同,首先軟鏈接可以跨越文件系統,其次,鏈接文件和源文件有着不同的inodedentry,因此,兩個文件的屬性和內容也截然不同,軟鏈接文件的文件內容是源文件的文件名。

在這裏插入圖片描述

硬鏈接實現

看完前面的關於硬鏈接和軟鏈接的介紹以後,接下來我們仔細考究下linux內核中對硬鏈接和軟鏈接的實現。

使用strace工具,可以發現建立硬鏈接調用的函數是link(),該函數的內核入口爲SYSCALL_DEFINE2(),其實就是sys_link()。我們就從這個入口開始一步步跟蹤實現原理。

SYSCALL_DEFINE2(link, const char __user *, oldname, const char __user *, newname)
{
   
   
    return sys_linkat(AT_FDCWD, oldname, AT_FDCWD, newname, 0);
}

sys_link()其實調用了函數sys_linkat(AT_FDCWD, oldname, AT_FDCWD, newname, 0)

SYSCALL_DEFINE5(linkat, int, olddfd, const char __user *, oldname,
int, newdfd, const char __user *, newname, int, flags)
{
   
   
    struct dentry *new_dentry;
    struct nameidata nd;
    struct path old_path;
    int error;
    char *to;

    if ((flags & ~AT_SYMLINK_FOLLOW) != 0)
        return -EINVAL;
    error = user_path_at(olddfd, oldname,
		         flags & AT_SYMLINK_FOLLOW ? LOOKUP_FOLLOW : 0,
		        &old_path);
    if (error)
        return error;

    /* 查找目的鏈接名的父目錄的dentry */
    error = user_path_parent(newdfd, newname, &nd, &to);
    if (error)
        goto out;

    error = -EXDEV;
    /* 如果源和目的不是同一個文件系統,則返回錯誤 */	
    if (old_path.mnt != nd.path.mnt)
        goto out_release;

    /* 爲鏈接文件創建dentry結構 */
    new_dentry = lookup_create(&nd, 0);
    error = PTR_ERR(new_dentry);
    if (IS_ERR(new_dentry))
        goto out_unlock;
    error = mnt_want_write(nd.path.mnt);
    if (error)
        goto out_dput;
    error = security_path_link(old_path.dentry, &nd.path, new_dentry);
    if (error)
        goto out_drop_write;
    error = vfs_link(old_path.dentry, nd.path.dentry->d_inode, new_dentry);
    ...
    return error;
}

其實,我們仔細思考+上面的圖示可以明白,創建硬鏈接所做的事情主要包含:爲鏈接文件創建一個dentry,初始化(主要是指初始化其inode號);將鏈接文件的dentry寫入父目錄的數據塊中。因此,上面的代碼頁就顯得一目瞭然,代碼主要做的事情有:

  • 合法性檢查,前面我們說硬鏈接不可跨越文件系統,這是因爲鏈接文件和源文件共用一個inode,而inode號在同一個文件系統內纔有意義;

  • 獲取鏈接文件父目錄的inode結構;

  • 爲鏈接文件創建一個dentry結構;

  • 等到一切準備工作就緒以後,初始化鏈接文件dentry結構中的inode號,並添加到父目錄的數據塊中。

上述步驟中的1、2、3在上面的函數中均有對應,而步驟4的主要工作則是在vfs_link()中進行,其傳入的實參的意義也在代碼中作了較爲詳細的說明,vfs_link()的實現如下:

int vfs_link(struct dentry *old_dentry, struct inode *dir, struct dentry *new_dentry)
{
   
   
    struct inode *inode = old_dentry->d_inode;
    int error;

    if (!inode)
        return -ENOENT;

    /* 檢查是否有創建文件目錄項權限 */
    error = may_create(dir, new_dentry);
    if (error)
        return error;

    if (dir->i_sb != inode->i_sb)
        return -EXDEV;

    if (IS_APPEND(inode) || IS_IMMUTABLE(inode))
        return -EPERM;

    /* 調用具體文件系統的link,如ext3_link() */
    if (!dir->i_op->link)
        return -EPERM;
    if (S_ISDIR(inode->i_mode))
        return -EPERM;

    error = security_inode_link(old_dentry, dir, new_dentry);
    if (error)
        return error;
    mutex_lock(&inode->i_mutex);
    error = dir->i_op->link(old_dentry, dir, new_dentry);
    mutex_unlock(&inode->i_mutex);
    if (!error)
        fsnotify_link(dir, inode, new_dentry);
     return error;
}

vfs_link()中主要完成一些參數檢查的任務,最終調用的是具體文件系統的link實現,如ext3文件系統的ext3_link()

static int ext3_link (struct dentry * old_dentry,
		       struct inode * dir, struct dentry *dentry)
{
   
   
    handle_t *handle;
    struct inode *inode = old_dentry->d_inode;
    int err, retries = 0;

    /* 如果文件上的鏈接數過多,返回Too many links錯誤 */
    if (inode->i_nlink >= EXT3_LINK_MAX)
        return -EMLINK;

    dquot_initialize(dir);

    if (inode->i_nlink == 0)
        return -ENOENT;
retry:
    handle = ext3_journal_start(dir, EXT3_DATA_TRANS_BLOCKS(dir->i_sb) +
					EXT3_INDEX_EXTRA_TRANS_BLOCKS);
    if (IS_ERR(handle))
        return PTR_ERR(handle);

    if (IS_DIRSYNC(dir))
        handle->h_sync = 1;

    inode->i_ctime = CURRENT_TIME_SEC;
    /* 將源文件inode上的鏈接數 + 1 */
    inc_nlink(inode);
    atomic_inc(&inode->i_count);

    /* 將鏈接文件的dentry寫入到其父目錄的數據塊中 */
    err = ext3_add_entry(handle, dentry, inode);
    if (!err) {
   
   
        ext3_mark_inode_dirty(handle, inode);
	d_instantiate(dentry, inode);
    } else {
   
   
	drop_nlink(inode);
	iput(inode);
    }
    ext3_journal_stop(handle);
    if (err == -ENOSPC && ext3_should_retry_alloc(dir->i_sb, &retries))
        goto retry;
     return err;
}

ext3_link()中完成鏈接的具體工作,拋開一些與日誌相關的內容,我們可以看到主要調用了ext3_add_entry()來將鏈接文件的dentry添加到父目錄的數據塊中,與此同時也會將源文件的inode號記錄在鏈接文件dentry中,這樣便達到了源文件和鏈接文件有着不同的dentry結構,卻共享inode的目的。

軟鏈接實現

使用strace工具,可以發現建立硬鏈接調用的函數是symlink()。該函數的內核入口爲SYSCALL_DEFINE2(symlink,...),其實就是sys_symlink()。我們就從這個入口開始一步步跟蹤內部實現原理。

SYSCALL_DEFINE2(symlink, const char __user *, oldname, const char __user *, newname)
{
   
   
    return sys_symlinkat(oldname, AT_FDCWD, newname);
}

sys_symlink()調用了函數sys_symlinkat(AT_FDCWD, oldname, AT_FDCWD, newname, 0)

SYSCALL_DEFINE3(symlinkat, const char __user *, oldname,
 int, newdfd, const char __user *, newname)
{
   
   
    ......
    from = getname(oldname);
    if (IS_ERR(from))
        return PTR_ERR(from);

    /* 查找軟鏈接父目錄結構,存於nd之中 */
    error = user_path_parent(newdfd, newname, &nd, &to);
    if (error)
        goto out_putname;

    /* 在上面查找的父目錄下創建軟連接dentry,作爲返回值 */
    dentry = lookup_create(&nd, 0);
    error = PTR_ERR(dentry);
    if (IS_ERR(dentry))
        goto out_unlock;

    error = mnt_want_write(nd.path.mnt);
    if (error)
        goto out_dput;
    error = security_path_symlink(&nd.path, dentry, from);
    if (error)
        goto out_drop_write;
 
    /* d_inode:鏈接文件父目錄inode結構
     * dentry:鏈接文件的dentry結構
     * from:源文件名
     */
    error = vfs_symlink(nd.path.dentry->d_inode, dentry, from);
    ......
    return error;
}

通過代碼可以看到,其基本的函數調用流程和sys_linkat一模一樣,只是最後調用的是vfs_symlinkat。而且,參數的意義稍有不同,可參見代碼註釋:

/* 建立軟鏈接
 * @dir:軟連接父目錄inode
 * @dentry:軟連接的dentry
 * @oldname:源文件或目錄的名字
 */
int vfs_symlink(struct inode *dir, struct dentry *dentry, const char *oldname)
{
   
   
    int error = may_create(dir, dentry);
    if (error)
        return error;

    if (!dir->i_op->symlink)
        return -EPERM;

    error = security_inode_symlink(dir, dentry, oldname);
    if (error)
        return error;

    error = dir->i_op->symlink(dir, dentry, oldname);
    if (!error)
	fsnotify_create(dir, dentry);

    return error;
}

最終還是調用了具體文件系統的symlink函數,如ext3_symlink()

//ext3建立軟連接函數
//@dir:軟連接的父目錄的inode
//@dentry:軟連接的dentry結構
//@symname:源文件名稱
static int ext3_symlink (struct inode * dir,
		struct dentry *dentry, const char * symname)
{
   
   
    handle_t *handle;
    struct inode * inode;
    int l, err, retries = 0;
 
    l = strlen(symname)+1;
    if (l > dir->i_sb->s_blocksize)
        return -ENAMETOOLONG;
    dquot_initialize(dir);

retry:
    handle = ext3_journal_start(dir, EXT3_DATA_TRANS_BLOCKS(dir->i_sb) +
					EXT3_INDEX_EXTRA_TRANS_BLOCKS + 5 +
					EXT3_MAXQUOTAS_INIT_BLOCKS(dir->i_sb));

    if (IS_ERR(handle))
        return PTR_ERR(handle);

    if (IS_DIRSYNC(dir))
	handle->h_sync = 1;

    // 爲軟連接創建一個新的inode結構
    inode = ext3_new_inode (handle, dir, S_IFLNK|S_IRWXUGO);
    err = PTR_ERR(inode);
    if (IS_ERR(inode))
        goto out_stop;

    if (l > sizeof (EXT3_I(inode)->i_data)) {
   
   
	inode->i_op = &ext3_symlink_inode_operations;
	ext3_set_aops(inode);
	err = __page_symlink(inode, symname, l, 1);
        if (err) {
   
   
	  ......
	}
    } else {
   
   
        /* 如果源文件名稱不夠長
         * 可直接將其保存在inode的i_data中
         */
	inode->i_op = &ext3_fast_symlink_inode_operations;
        memcpy((char*)&EXT3_I(inode)->i_data,symname,l);
        inode->i_size = l-1;
    }
    EXT3_I(inode)->i_disksize = inode->i_size;
    /* 將鏈接文件的inode和dentry關聯並
     * 與其父目錄建立關聯
     */
    err = ext3_add_nondir(handle, dentry, inode);

out_stop:
    .....
}

分析ext3_symlink的實現,拋開日誌等模塊不談,有以下幾個關鍵步驟:

  • 代碼中會爲鏈接文件創建一個inode結構,這在函數ext3_new_inode()中實現,這也是硬鏈接和軟鏈接的最大不同;
  • 鏈接文件的文件內容是源文件的文件名,而且,如果文件名不是很長(小於60字節),會將文件名直接保存在inode中,無需爲其分配數據塊;
  • 最後會將鏈接文件的inodedentry建立關聯,並將鏈接文件的dentry寫入到父目錄的數據塊中,調用的是函數ext3_add_nondir()

Linux、C/C++技術交流羣:【960994558】整理了一些個人覺得比較好的學習書籍、大廠面試題、和熱門技術教學視頻資料共享在裏面(包括C/C++,Linux,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,ZK,流媒體,CDN,P2P,K8S,Docker,TCP/IP,協程,DPDK等等.),有需要的可以自行添加哦!~在這裏插入圖片描述

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章