Linus:利用二級指針刪除單向鏈表

轉自:http://coolshell.cn/articles/8990.html


感謝網友full_of_bull投遞此文(注:此文最初發表在這個這裏,我對原文後半段修改了許多,並加入了插圖)

Linus大嬸在slashdot上回答一些編程愛好者的提問,其中一個人問他什麼樣的代碼是他所喜好的,大嬸表述了自己一些觀點之後,舉了一個指針的例子,解釋了什麼纔是core low-level coding

下面是Linus的教學原文及翻譯——

“At the opposite end of the spectrum, I actually wish more people understood the really core low-level kind of coding. Not big, complex stuff like the lockless name lookup, but simply good use of pointers-to-pointers etc. For example, I’ve seen too many people who delete a singly-linked list entry by keeping track of the “prev” entry, and then to delete the entry, doing something like。(在這段話的最後,我實際上希望更多的人瞭解什麼是真正的核心底層代碼。這並不像無鎖文件名查詢(注:可能是git源碼裏的設計)那樣龐大、復 雜,只是僅僅像諸如使用二級指針那樣簡單的技術。例如,我見過很多人在刪除一個單項鍊表的時候,維護了一個”prev”表項指針,然後刪除當前表項,就像 這樣)”

1
2
3
4
if (prev)
    prev->next = entry->next;
else
    list_head = entry->next;

and whenever I see code like that, I just go “This person doesn’t understand pointers”. And it’s sadly quite common.(當我看到這樣的代碼時,我就會想“這個人不瞭解指針”。令人難過的是這太常見了。)

People who understand pointers just use a “pointer to the entry pointer”, and initialize that with the address of the list_head. And then as they traverse the list, they can remove the entry without using any conditionals, by just doing a “*pp = entry->next”. (瞭解指針的人會使用鏈表頭的地址來初始化一個“指向節點指針的指針”。當遍歷鏈表的時候,可以不用任何條件判斷(注:指prev是否爲鏈表頭)就能移除 某個節點,只要寫)

1
*pp = entry->next

So there’s lots of pride in doing the small details right. It may not be big and important code, but I do like seeing code where people really thought about the details, and clearly also were thinking about the compiler being able to generate efficient code (rather than hoping that the compiler is so smart that it can make efficient code *despite* the state of the original source code). (糾正細節是令人自豪的事。也許這段代碼並非龐大和重要,但我喜歡看那些注重代碼細節的人寫的代碼,也就是清楚地瞭解如何才能編譯出有效代碼(而不是寄望於聰明的編譯器來產生有效代碼,即使是那些原始的彙編代碼))。

Linus舉了一個單向鏈表的例子,但給出的代碼太短了,一般的人很難搞明白這兩個代碼後面的含義。正好,有個編程愛好者閱讀了這段話,並給出了一個比較完整的代碼。他的話我就不翻譯了,下面給出代碼說明。

如果我們需要寫一個remove_if(link*, rm_cond_func*)的函數,也就是傳入一個單向鏈表,和一個自定義的是否刪除的函數,然後返回處理後的鏈接。

這個代碼不難,基本上所有的教科書都會提供下面的代碼示例,而這種寫法也是大公司的面試題標準模板:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
typedef struct node
{
    struct node * next;
    ....
} node;
 
typedef bool (* remove_fn)(node const * v);
 
// Remove all nodes from the supplied list for which the
// supplied remove function returns true.
// Returns the new head of the list.
node * remove_if(node * head, remove_fn rm)
{
    for (node * prev = NULL, * curr = head; curr != NULL; )
    {
        node * const next = curr->next;
        if (rm(curr))
        {
            if (prev)
                prev->next = next;
            else
                head = next;
            free(curr);
        }
        else
            prev = curr;
        curr = next;
    }
    return head;
}

這裏remove_fn由調用查提供的一個是否刪除當前實體結點的函數指針,其會判斷刪除條件是否成立。這段代碼維護了兩個節點指針prev和curr,標準的教科書寫法——刪除當前結點時,需要一個previous的指針,並且還要這裏還需要做一個邊界條件的判斷——curr是否爲鏈表頭。於是,要刪除一個節點(不是表頭),只要將前一個節點的next指向當前節點的next指向的對象,即下一個節點(即:prev->next = curr->next),然後釋放當前節點。

但在Linus看來,這是不懂指針的人的做法。那麼,什麼是core low-level coding呢?那就是有效地利用二級指針,將其作爲管理和操作鏈表的首要選項。代碼如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
void remove_if(node ** head, remove_fn rm)
{
    for (node** curr = head; *curr; )
    {
        node * entry = *curr;
        if (rm(entry))
        {
            *curr = entry->next;
            free(entry);
        }
        else
            curr = &entry->next;
    }
}

同上一段代碼有何改進呢?我們看到:不需要prev指針了,也不需要再去判斷是否爲鏈表頭了,但是,curr變成了一個指向指針的指針。這正是這段程序的精妙之處。(注意,我所highlight的那三行代碼)

讓我們來人肉跑一下這個代碼,對於——

  • 刪除節點是表頭的情況,輸入參數中傳入head的二級指針,在for循環裏將其初始化curr,然後entry就是*head(*curr),我們馬上刪除它,那麼第8行就等效於*head = (*head)->next,就是刪除表頭的實現。

  • 刪除節點不是表頭的情況,對於上面的代碼,我們可以看到——

1)(第12行)如果不刪除當前結點 —— curr保存的是當前結點next指針的地址

2)(第5行) entry 保存了 *curr —— 這意味着在下一次循環:entry就是prev->next指針所指向的內存。

3)(第8行)刪除結點:*curr = entry->next; —— 於是:prev->next 指向了 entry -> next;

是不是很巧妙?我們可以只用一個二級指針來操作鏈表,對所有節點都一樣。

如果你對上面的代碼和描述理解上有困難的話,你可以看看下圖的示意:

(全文完)


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章