【動態規劃】最長公共子序列和最長公共子串(python)

編寫用時:2020年3月12日12:02:28~1h
動態規劃經典例題——最長公共子序列和最長公共子串(python)
很久之前大概是高中的時候寫過這種題目,使用動態規劃的方法求解的,現讀研究生了,要把過去的拾起來的呢。

1. 最長公共子序列(LCS)

1.1 問題描述

在這裏插入圖片描述

1.2 思路

利用動態規劃。
在這裏插入圖片描述
下一步就要找到狀態之間的轉換方程。
在這裏插入圖片描述
因此可以根據這個方程來進行填表,以"helloworld"和“loop”爲例:
在這裏插入圖片描述

1.3 Python代碼

def LCS(string1,string2):
    len1 = len(string1)
    len2 = len(string2)
    res = [[0 for i in range(len1+1)] for j in range(len2+1)] 
     #python 初始化二維數組 [len2+1],[len1+1]
    for i in range(1,len2+1):  #開始從1開始,到len2+1結束
        for j in range(1,len1+1):  #開始從1開始,到len2+1結束
            if string2[i-1] == string1[j-1]:
                res[i][j] = res[i-1][j-1]+1
            else:
                res[i][j] = max(res[i-1][j],res[i][j-1])
    return res,res[-1][-1]  #返回res[len2+1][len1+1]
print(LCS("helloworld","loop"))
# 輸出結果爲:
[[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1],
 [0, 0, 0, 1, 1, 2, 2, 2, 2, 2, 2],
 [0, 0, 0, 1, 1, 2, 2, 3, 3, 3, 3],
 [0, 0, 0, 1, 1, 2, 2, 3, 3, 3, 3]], 3

所以"helloworld"和"loop"的最長公共子序列的長度爲3。

1.4 找到具體的子序列

下面的內容借鑑了博主Running07的博客動態規劃 最長公共子序列 過程圖解
如果有兩個字符串如下:
S1 = “123456778”
S2 = “357486782”
其最終的動態規劃填表結果爲:
在這裏插入圖片描述
其中S1和S2的LCS並不是只有1個。
我們根據遞歸公式:

構建了上表,
通過遞推公式,可以看出,res[i][j]的值來源於res[i-1][j]或者是res[i-1][j]和res[i][j-1]的較大值(可能相等)。
我們將從最後一個元素c[8][9]倒推出S1和S2的LCS。
res[8][9] = 5,且S1[8] != S2[9],所以倒推回去,res[8][9]的值來源於c[8][8]的值(因爲res[8][8] > res[7][9])。
res[8][8] = 5, 且S1[8] = S2[8], 所以倒推回去,res[8][8]的值來源於 res[7][7]。
以此類推,如果遇到S1[i] != S2[j] ,且res[i-1][j] = res[i][j-1] 這種存在分支的情況,這裏都選擇一個方向(之後遇到這樣的情況,也選擇相同的方向,要麼都往左,要麼都往上)。
在這裏插入圖片描述

可得S1和S2的LCS爲{3、5、7、7、8} 這是遇見相等的時候,統一往左走
S1和S2之間還有一個LCS 這是遇見相等的時候,統一往上走:
在這裏插入圖片描述
可得S1和S2的LCS爲{3、4、6、7、8}

def LCS(string1,string2):
    len1 = len(string1)
    len2 = len(string2)
    res = [[0 for i in range(len1+1)] for j in range(len2+1)]  #python 初始化二維數組 [len1+1],[len2+1]
    for i in range(1,len2+1):  #開始從1開始,到len2+1結束
        for j in range(1,len1+1):  #開始從1開始,到len2+1結束
            if string2[i-1] == string1[j-1]:
                res[i][j] = res[i-1][j-1]+1
            else:
                res[i][j] = max(res[i-1][j],res[i][j-1])
    string=""  
    i=len(string2);
    j=len(string1);
    while (i > 0) & (j > 0):  #一開始我不知道加()邏輯錯誤
        #開始從1開始,到len2+1結束
        print(i,j)
        if string2[i-1] == string1[j-1]:
            string=string+string2[i-1]
            i=i-1
            j=j-1
        else:
            if res[i-1][j]>res[i][j-1]:
                i=i-1
            elif res[i-1][j]<res[i][j-1]:
                j=j-1
            else:
                i=i-1
    return res,res[-1][-1],string[::-1]  # 倒序輸出
print(LCS("helloworld","loop"))

輸出:
4 10
3 10
3 9
3 8
3 7
2 6
2 5
1 4
([[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1], [0, 0, 0, 1, 1, 2, 2, 2, 2, 2, 2], [0, 0, 0, 1, 1, 2, 2, 3, 3, 3, 3],
 [0, 0, 0, 1, 1, 2, 2, 3, 3, 3, 3]], 3, 'loo')

2. 最長公共子串

2.1 問題描述

在這裏插入圖片描述

2.2 思路

和最長公共子序列一樣,使用動態規劃的算法。
在這裏插入圖片描述
下一步就要找到狀態之間的轉換方程。
和LCS問題唯一不同的地方在於當A[i] != B[j]時,res[i][j]就直接等於0了,因爲子串必須連續,且res[i][j] 表示的是以A[i],B[j]截尾的公共子串的長度。因此可以根據這個方程來進行填表,以"helloworld"和“loop”爲例:
在這裏插入圖片描述
這個和LCS問題還有一點不同的就是,需要設置一個result,每一步都更新得到最長公共子串的長度。

2.3 Python代碼

def LCstring(string1,string2):
    len1 = len(string1)
    len2 = len(string2)
    res = [[0 for i in range(len1+1)] for j in range(len2+1)]
    result = 0
    for i in range(1,len2+1):
        for j in range(1,len1+1):
            if string2[i-1] == string1[j-1]:
                res[i][j] = res[i-1][j-1]+1
                result = max(result,res[i][j])  
    return result
print(LCstring("helloworld","loop"))
# 輸出結果爲:2

2.4 返回子串

def LCS(string1,string2):
    len1 = len(string1)
    len2 = len(string2)
    res = [[0 for i in range(len1+1)] for j in range(len2+1)]  #python 初始化二維數組 [len1+1],[len2+1]
    result =0
    index=0
    for i in range(1,len2+1):  #開始從1開始,到len2+1結束
        for j in range(1,len1+1):  #開始從1開始,到len2+1結束
            if string2[i-1] == string1[j-1]:
                res[i][j] = res[i-1][j-1]+1
                if result<res[i][j]:
                    index=i
                result = max(res[i][j],result)         
    string=string2[index-result:index] 
   
    return res,result,string  # 輸出
print(LCS("hellooxworld","looxoxp"))

([[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 0], [0, 0, 0, 0, 0, 2, 1, 0, 0, 1, 0, 0, 0], [0, 0, 0, 0, 0, 1, 3, 0, 0, 1, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 4, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]], 
4, 'loox')
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章