算法:遞歸解題

前言

遞歸是算法中一種非常重要的思想,應用也很廣,小到階乘,再在工作中用到的比如統計文件夾大小,大到 Google 的 PageRank 算法都能看到,也是面試官很喜歡的考點
最近看了不少遞歸的文章,收穫不小,不過我發現大部分網上的講遞歸的文章都不太全面,主要的問題在於解題後大部分都沒有給出相應的時間/空間複雜度,而時間/空間複雜度是算法的重要考量!遞歸算法的時間複雜度普遍比較難(需要用到歸納法等),換句話說,如果能解決遞歸的算法複雜度,其他算法題題的時間複雜度也基本不在話下。另外,遞歸算法的時間複雜度不少是不能接受的,如果發現算出的時間複雜度過大,則需要轉換思路,看下是否有更好的解法 ,這纔是根本目的,不要爲了遞歸而遞歸!
本文試圖從以下幾個方面來講解遞歸
什麼是遞歸?
遞歸算法通用解決思路
實戰演練(從初級到高階)
力爭讓大家對遞歸的認知能上一個新臺階,特別會對遞歸的精華:時間複雜度作詳細剖析,會給大家總結一套很通用的求解遞歸時間複雜度的套路,相信你看完肯定會有收穫
什麼是遞歸
簡單地說,就是如果在函數中存在着調用函數本身的情況,這種現象就叫遞歸。
以階乘函數爲例,如下, 在 factorial 函數中存在着 factorial(n - 1) 的調用,所以此函數是遞歸函數

public int factorial(int n) {
    if (n < =1) {
        return 1;
    }
    return n * factorial(n - 1)
}

進一步剖析「遞歸」,先有「遞」再有「歸」,「遞」的意思是將問題拆解成子問題來解決, 子問題再拆解成子子問題,…,直到被拆解的子問題無需再拆分成更細的子問題(即可以求解),「歸」是說最小的子問題解決了,那麼它的上一層子問題也就解決了,上一層的子問題解決了,上上層子問題自然也就解決了,…,直到最開始的問題解決,文字說可能有點抽象,那我們就以階層 f(6) 爲例來看下它的「遞」和「歸」。
在這裏插入圖片描述
求解問題 f(6), 由於 f(6) = n * f(5), 所以 f(6) 需要拆解成 f(5) 子問題進行求解,同理 f(5) = n * f(4) ,也需要進一步拆分,… ,直到 f(1), 這是「遞」,f(1) 解決了,由於 f(2) = 2 f(1) = 2 也解決了,… f(n)到最後也解決了,這是「歸」,所以遞歸的本質是能把問題拆分成具有相同解決思路的子問題,。。。直到最後被拆解的子問題再也不能拆分,解決了最小粒度可求解的子問題後,在「歸」的過程中自然順其自然地解決了最開始的問題。

遞歸算法通用解決思路
我們在上一節仔細剖析了什麼是遞歸,可以發現遞歸有以下兩個特點
一個問題可以分解成具有相同解決思路的子問題,子子問題,換句話說這些問題都能調用同一個函數
經過層層分解的子問題最後一定是有一個不能再分解的固定值的(即終止條件),如果沒有的話,就無窮無盡地分解子問題了,問題顯然是無解的。
所以解遞歸題的關鍵在於我們首先需要根據以上遞歸的兩個特點判斷題目是否可以用遞歸來解。
經過判斷可以用遞歸後,接下來我們就來看看用遞歸解題的基本套路(四步曲):
先定義一個函數,明確這個函數的功能,由於遞歸的特點是問題和子問題都會調用函數自身,所以這個函數的功能一旦確定了, 之後只要找尋問題與子問題的遞歸關係即可
接下來尋找問題與子問題間的關係(即遞推公式),這樣由於問題與子問題具有相同解決思路,只要子問題調用步驟 1 定義好的函數,問題即可解決。所謂的關係最好能用一個公式表示出來,比如 f(n) = n * f(n-) 這樣,如果暫時無法得出明確的公式,用僞代碼表示也是可以的, 發現遞推關係後,要尋找最終不可再分解的子問題的解,即(臨界條件),確保子問題不會無限分解下去。由於第一步我們已經定義了這個函數的功能,所以當問題拆分成子問題時,子問題可以調用步驟 1 定義的函數,符合遞歸的條件(函數裏調用自身)
將第二步的遞推公式用代碼表示出來補充到步驟 1 定義的函數中
最後也是很關鍵的一步,根據問題與子問題的關係,推導出時間複雜度,如果發現遞歸時間複雜度不可接受,則需轉換思路對其進行改造,看下是否有更靠譜的解法
聽起來是不是很簡單,接下來我們就由淺入深地來看幾道遞歸題,看下怎麼用上面的幾個步驟來套
實戰演練(從初級到高階)

熱身賽
輸入一個正整數n,輸出n!的值。其中n!=123*…*n,即求階乘

套用上一節我們說的遞歸四步解題套路來看看怎麼解
定義這個函數,明確這個函數的功能,我們知道這個函數的功能是求 n 的階乘, 之後求 n-1, n-2 的階乘就可以調用此函數了

定義這個函數,明確這個函數的功能,我們知道這個函數的功能是求 n 的階乘, 之後求 n-1, n-2 的階乘就可以調用此函數了

/**
 * 求 n 的階乘
 */
public int factorial(int n) {
}

2.尋找問題與子問題的關係 階乘的關係比較簡單, 我們以 f(n) 來表示 n 的階乘, 顯然 f(n) = n * f(n - 1), 同時臨界條件是 f(1) = 1,即
在這裏插入圖片描述
3.將第二步的遞推公式用代碼表示出來補充到步驟 1 定義的函數中

/**
 * 求 n 的階乘
 */
public int factorial(int n) {
    // 第二步的臨界條件
    if (n < =1) {
        return 1;
    }

    // 第二步的遞推公式
    return n * factorial(n-1)
}

4.求時間複雜度 由於 f(n) = n * f(n-1) = n * (n-1) * … * f(1),總共作了 n 次乘法,所以時間複雜度爲 n。
看起來是不是有這麼點眉目, 當然這道題確實太過簡單,很容易套路,那我們再來看進階一點的題

入門題

一隻青蛙可以一次跳 1 級臺階或一次跳 2 級臺階,例如:
跳上第 1 級臺階只有一種跳法:直接跳 1 級即可。跳上第 2 級臺階
有兩種跳法:每次跳 1 級,跳兩次;或者一次跳 2 級。
問要跳上第 n 級臺階有多少種跳法?

我們繼續來按四步曲來看怎麼套路
1.定義一個函數,這個函數代表了跳上 n 級臺階的跳法

/**
 * 跳 n 極臺階的跳法
 */
public int f(int n) {
}

2.尋找問題與子問題之前的關係 這兩者之前的關係初看確實看不出什麼頭緒,但仔細看題目,一隻青蛙只能跳一步或兩步臺階,自上而下地思考,也就是說如果要跳到 n 級臺階只能從 從 n-1 或 n-2 級跳, 所以問題就轉化爲跳上 n-1 和 n-2 級臺階的跳法了,如果 f(n) 代表跳到 n 級臺階的跳法,那麼從以上分析可得 f(n) = f(n-1) + f(n-2),顯然這就是我們要找的問題與子問題的關係,而顯然當 n = 1, n = 2, 即跳一二級臺階是問題的最終解,於是遞推公式係爲

在這裏插入圖片描述

3.將第二步的遞推公式用代碼表示出來補充到步驟 1 定義的函數中 補充後的函數如下

/**
 * 跳 n 極臺階的跳法
 */
public int f(int n) {
    if (n == 1) return 1;
    if (n == 2) return 2;
    return f(n-1) + f(n-2)
}

在這裏插入圖片描述
在這裏插入圖片描述
5.優化
既然有這麼多的重複計算,我們可以想到把這些中間計算過的結果保存起來,如果之後的計算中碰到同樣需要計算的中間態,直接在這個保存的結果裏查詢即可,這就是典型的 以空間換時間,改造後的代碼如下

public int f(int n) {
    if (n == 1) return 1;
    if (n == 2) return 2;
    // map 即保存中間態的鍵值對, key 爲 n,value 即 f(n)
    if (map.get(n)) {
        return map.get(n)
    }
    return f(n-1) + f(n-2)
}

那麼改造後的時間複雜度是多少呢,由於對每一個計算過的 f(n) 我們都保存了中間態 ,不存在重複計算的問題,所以時間複雜度是 O(n), 但由於我們用了一個鍵值對來保存中間的計算結果,所以空間複雜度是 O(n)。問題到這裏其實已經算解決了,但身爲有追求的程序員,我們還是要問一句,空間複雜度能否繼續優化?
6.使用循環迭代來改造算法 我們在分析問題與子問題關係(f(n) = f(n-1) + f(n-2))的時候用的是自頂向下的分析方式,但其實我們在解 f(n) 的時候可以用自下而上的方式來解決,通過觀察我們可以發現以下規律

f(1) = 1
f(2) = 2
f(3) = f(1) + f(2) = 3
f(4) = f(3) + f(2) = 5
....
f(n) = f(n-1) + f(n-2)

最底層 f(1), f(2) 的值是確定的,之後的 f(3), f(4) ,…等問題都可以根據前兩項求解出來,一直到 f(n)。所以我們的代碼可以改造成以下方式

public int f(int n) {
    if (n == 1) return 1;
    if (n == 2) return 2;

    int result = 0;
    int pre = 1;
    int next = 2;
    
    for (int i = 3; i < n + 1; i ++) {
        result = pre + next;
        pre = next;
        next = result;
    }
    return result;
}

改造後的時間複雜度是 O(n), 而由於我們在計算過程中只定義了兩個變量(pre,next),所以空間複雜度是O(1)
簡單總結一下:分析問題我們需要採用自上而下的思維,而解決問題有時候採用自下而上的方式能讓算法性能得到極大提升,思路比結論重要

初級題

接下來我們來看下一道經典的題目: 反轉二叉樹 將左邊的二叉樹反轉成右邊的二叉樹
在這裏插入圖片描述

接下來讓我們看看用我們之前總結的遞歸解法四步曲如何解題
1.定義一個函數,這個函數代表了翻轉以 root 爲根節點的二叉樹

public static class TreeNode {
    int val;
    TreeNode left;
    TreeNode right;
    TreeNode(int x) { val = x; }
}

public TreeNode invertTree(TreeNode root) {
}

2.查找問題與子問題的關係,得出遞推公式 我們之前說了,解題要採用自上而下的思考方式,那我們取前面的1, 2,3 結點來看,對於根節點 1 來說,假設 2, 3 結點下的節點都已經翻轉,那麼只要翻轉 2, 3 節點即滿足需求
在這裏插入圖片描述
對於2, 3 結點來說,也是翻轉其左右節點即可,依此類推,對每一個根節點,依次翻轉其左右節點,所以我們可知問題與子問題的關係是 翻轉(根節點) = 翻轉(根節點的左節點) + 翻轉(根節點的右節點) 即

invert(root) = invert(root->left) + invert(root->right)

而顯然遞歸的終止條件是當結點爲葉子結點時終止(因爲葉子節點沒有左右結點)
3.將第二步的遞推公式用代碼表示出來補充到步驟 1 定義的函數中

 public TreeNode invertTree(TreeNode root) {
    // 葉子結果不能翻轉
    if (root == null) {
        return null;
    }
    // 翻轉左節點下的左右節點
    TreeNode left = invertTree(root.left);
    // 翻轉右節點下的左右節點
    TreeNode right = invertTree(root.right);

    // 左右節點下的二叉樹翻轉好後,翻轉根節點的左右節點
    root.right = left;
    root.left = right;
    return root;
}

4.時間複雜度分析 由於我們會對每一個節點都去做翻轉,所以時間複雜度是 O(n),那麼空間複雜度呢,這道題的空間複雜度非常有意思,我們一起來看下,由於每次調用 invertTree 函數都相當於一次壓棧操作, 那最多壓了幾次棧呢, 仔細看上面函數的下一段代碼

 TreeNode left = invertTree(root.left);

從根節點出發不斷對左結果調用翻轉函數, 直到葉子節點,每調用一次都會壓棧,左節點調用完後,出棧,再對右節點壓棧…,下圖可知棧的大小爲3, 即樹的高度,如果是完全二叉樹 ,則樹的高度爲logn, 即空間複雜度爲O(logn)
在這裏插入圖片描述
最壞情況,如果此二叉樹是如圖所示(只有左節點,沒有右節點),則樹的高度即結點的個數 n,此時空間複雜度爲 O(n),總的來看,空間複雜度爲O(n)
在這裏插入圖片描述
說句題外話,這道題當初曾引起轟動,因爲 Mac 下著名包管理工具 homebrew 的作者 Max Howell 當初解不開這道題,結果被 Google 拒了,也就是說如果你解出了這道題,就超越了這位世界大神,想想是不是很激動

進階題

現實中大廠中的很多遞歸題都不會用上面這些相對比較容易理解的題,更加地是對遞歸問題進行相應地變形, 來看下面這道題

細胞分裂 有一個細胞 每一個小時分裂一次,一次分裂一個子細胞,第三個小時後會死亡。那麼n個小時候有多少細胞?

照樣我們用前面的遞歸四步曲來解

1.定義問題的遞歸函數,明確函數的功能 我們定義以下函數爲 n 個小時後的細胞數

public int allCells(int n) {
}

2.接下來尋找問題與子問題間的關係(即遞推公式) 首先我們看一下一個細胞出生到死亡後經歷的所有細胞分裂過程

在這裏插入圖片描述
圖中的 A 代表細胞的初始態, B代表幼年態(細胞分裂一次), C 代表成熟態(細胞分裂兩次),C 再經歷一小時後細胞死亡 以 f(n) 代表第 n 小時的細胞分解數 fa(n) 代表第 n 小時處於初始態的細胞數, fb(n) 代表第 n 小時處於幼年態的細胞數 fc(n) 代表第 n 小時處於成熟態的細胞數 則顯然 f(n) = fa(n) + fb(n) + fc(n) 那麼 fa(n) 等於多少呢,以n = 4 (即一個細胞經歷完整的生命週期)爲例
仔細看上面的圖
可以看出 fa(n) = fa(n-1) + fb(n-1) + fc(n-1), 當 n = 1 時,顯然 fa(1) = 1
fb(n) 呢,看下圖可知 fb(n) = fa(n-1)。當 n = 1 時 fb(n) = 0
在這裏插入圖片描述
fc(n) 呢,看下圖可知 fc(n) = fb(n-1)。當 n = 1,2 時 fc(n) = 0
在這裏插入圖片描述
綜上, 我們得出的遞歸公式如下
f(n) =  fa(n)  + fb(n)  + fc(n)

3.根據以上遞歸公式我們補充一下函數的功能

public int allCells(int n) {
    return aCell(n) + bCell(n) + cCell(n);
}

/**
 * 第 n 小時 a 狀態的細胞數
 */
public int aCell(int n) {
    if(n==1){
        return 1;
    }else{
        return aCell(n-1)+bCell(n-1)+cCell(n-1);
    }
}

/**
 * 第 n 小時 b 狀態的細胞數
 */
public int bCell(int n) {
    if(n==1){
        return 0;
    }else{
        return aCell(n-1);
    }
}

/**
 * 第 n 小時 c 狀態的細胞數
 */
public int cCell(int n) {
    if(n==1 || n==2){
        return 0;
    }else{
        return bCell(n-1);
    }
}

只要思路對了,將遞推公式轉成代碼就簡單多了,另一方面也告訴我們,可能一時的遞歸關係我們看不出來,此時可以藉助於畫圖來觀察規律
4.求時間複雜度 由第二步的遞推公式我們知道 f(n) = 2aCell(n-1) + 2aCell(n-2) + aCell(n-3)
之前青蛙跳臺階時間複雜度是指數級別的,而這個方程式顯然比之前的遞推公式(f(n) = f(n-1) + f(n-2)) 更復雜的,所以顯然也是指數級別的

總結

大部分遞歸題其實還是有跡可尋的, 按照之前總結的解遞歸的四個步驟可以比較順利的解開遞歸題,一些比較複雜的遞歸題我們需要勤動手,畫畫圖,觀察規律,這樣能幫助我們快速發現規律,得出遞歸公式,一旦知道了遞歸公式,將其轉成遞歸代碼就容易多了,很多大廠的遞歸考題並不能簡單地看出遞歸規律,往往會在遞歸的基礎上多加一些變形,不過萬遍不離其宗,我們多采用自頂向下的分析思維,多練習,相信遞歸不是什麼難事

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章