目錄
下面演示下c數組的填表過程:(以求ABCB和BDCA的LCS長度爲例):
相關概念
子序列形式化定義:
給定一個序列X=<x1,x2,x3,x4...,xm>,另一個序列Z=<z1,z2,z3,z4...,zk>,若存在一個嚴格遞增的X的下標序列<i1,i2,i3,...,ik>對所有的1,2,3,...,k,都滿足x(ik)=zk,則稱Z是X的子序列
比如Z=<B,C,D,B>是X=<A,B,C,B,D,A,B>的子序列
公共子序列定義:
如果Z既是X的子序列,又是Y的子序列,則稱Z爲X和Y的公共子序列
最長公共子序列(以下簡稱LCS):
2個序列的子序列中長度最長的那個
方法
蠻力法求解最長公共子序列:
需要遍歷出所有的可能,時間複雜度是O(n³),太慢了
動態規劃求解最長公共子序列:
分析規律:
設X=<x1,x2,x3,x4...,xm>,Y=<y1,y2,y3,y4...,yn>爲兩個序列,Z=<z1,z2,z3,z4...,zk>是他們的任意公共子序列
經過分析,我們可以知道:
1、如果xm = yn,則zk = xm = yn 且 Zk-1是Xm-1和Yn-1的一個LCS
2、如果xm != yn 且 zk != xm,則Z是Xm-1和Y的一個LCS
3、如果xm != yn 且 zk != yn,則Z是X和Yn-1的一個LCS
所以如果用一個二維數組c表示字符串X和Y中對應的前i,前j個字符的LCS的長度話,可以得到以下公式:
文字意思就是:
設
p1表示X的前 i-1 個字符和Y的前 j 個字符的LCS的長度
p2表示X的前 i 個字符和Y的前 j-1 個字符的LCS的長度
p表示X的前 i-1 個字符和Y的前 j-1 個字符的LCS的長度
p0表示X的前 i 個字符和Y的前 j 個字符的LCS的長度
如果X的第 i 個字符和Y的第 j 個字符相等,則p0 = p + 1
如果X的第 i 個字符和Y的第 j 個字符不相等,則p0 = max(p1,p2)
做法:
因此,我們只需要從c[0][0]開始填表,填到c[m-1][n-1],所得到的c[m-1][n-1]就是LCS的長度
但是,我們怎麼得到LCS本身而非LCS的長度呢?
也是用一個二維數組b來表示:
在對應字符相等的時候,用↖標記
在p1 >= p2的時候,用↑標記
在p1 < p2的時候,用←標記
僞代碼:
若想得到LCS,則再遍歷一次b數組就好了,從最後一個位置開始往前遍歷:
如果箭頭是↖,則代表這個字符是LCS的一員,存下來後 i-- , j--
如果箭頭是←,則代表這個字符不是LCS的一員,j--
如果箭頭是↑ ,也代表這個字符不是LCS的一員,i--
如此直到i = 0或者j = 0時停止,最後存下來的字符就是所有的LCS字符
比如說求ABCBDAB和BDCABA的LCS:
灰色且帶↖箭頭的部分即爲所有的LCS的字符
下面演示下c數組的填表過程:(以求ABCB和BDCA的LCS長度爲例):
以此類推
最後填出的表爲:
右下角的2即爲LCS的長度
時間複雜度:
由於只需要填一個m行n列的二維數組,其中m代表第一個字符串長度,n代表第二個字符串長度
所以時間複雜度爲O(m*n)
代碼:
#include <iostream>
#include <string>
#include <stack>
using namespace std;
void LCS(string s1,string s2)
{
int m=s1.length()+1;
int n=s2.length()+1;
int **c;
int **b;
c=new int* [m];
b=new int* [m];
for(int i=0;i<m;i++)
{
c[i]=new int [n];
b[i]=new int [n];
for(int j=0;j<n;j++)
b[i][j]=0;
}
for(int i=0;i<m;i++)
c[i][0]=0;
for(int i=0;i<n;i++)
c[0][i]=0;
for(int i=0;i<m-1;i++)
{
for(int j=0;j<n-1;j++)
{
if(s1[i]==s2[j])
{
c[i+1][j+1]=c[i][j]+1;
b[i+1][j+1]=1; //1表示箭頭爲 左上
}
else if(c[i][j+1]>=c[i+1][j])
{
c[i+1][j+1]=c[i][j+1];
b[i+1][j+1]=2; //2表示箭頭向 上
}
else
{
c[i+1][j+1]=c[i+1][j];
b[i+1][j+1]=3; //3表示箭頭向 左
}
}
}
for(int i=0;i<m;i++) //輸出c數組
{
for(int j=0;j<n;j++)
{
cout<<c[i][j]<<' ';
}
cout<<endl;
}
stack<char> same; //存LCS字符
stack<int> same1,same2; //存LCS字符在字符串1和字符串2中對應的下標,方便顯示出來
for(int i = m-1,j = n-1;i >= 0 && j >= 0; )
{
if(b[i][j] == 1)
{
i--;
j--;
same.push(s1[i]);
same1.push(i);
same2.push(j);
}
else if(b[i][j] == 2)
i--;
else
j--;
}
cout<<s1<<endl; //輸出字符串1
for(int i=0;i<m && !same1.empty();i++) //輸出字符串1的標記
{
if(i==same1.top())
{
cout<<1;
same1.pop();
}
else
cout<<' ';
}
cout<<endl<<s2<<endl; //輸出字符串2
for(int i=0;i<n && !same2.empty();i++) //輸出字符串2的標記
{
if(i==same2.top())
{
cout<<1;
same2.pop();
}
else
cout<<' ';
}
cout<<endl<<"最長公共子序列爲:";
while(!same.empty())
{
cout<<same.top();
same.pop();
}
cout<<endl<<"長度爲:"<<c[m-1][n-1]<<endl;
for (int i = 0; i<m; i++)
{
delete [] c[i];
delete [] b[i];
}
delete []c;
delete []b;
}
int main()
{
string s1="ABCPDSFJGODIHJOFDIUSHGD";
string s2="OSDIHGKODGHBLKSJBHKAGHI";
LCS(s1,s2);
return 0;
}