題目:
給定兩個字符串 text1 和 text2,返回這兩個字符串的最長公共子序列。
一個字符串的 子序列 是指這樣一個新的字符串:它是由原字符串在不改變字符的相對順序的情況下刪除某些字符(也可以不刪除任何字符)後組成的新字符串。
例如,“ace” 是 “abcde” 的子序列,但 “aec” 不是 “abcde” 的子序列。兩個字符串的「公共子序列」是這兩個字符串所共同擁有的子序列。
若這兩個字符串沒有公共子序列,則返回 0。
來源:力扣(LeetCode)
鏈接:https://leetcode-cn.com/problems/longest-common-subsequence
著作權歸領釦網絡所有。商業轉載請聯繫官方授權,非商業轉載請註明出處。
輸入:text1 = “abcde”, text2 = “ace”
輸出:3
解釋:最長公共子序列是 “ace”,它的長度爲 3。
暴力算法,常規思路
從樣例輸入輸出入手,輸入兩個字符串:abcde/ace。
按照字符串角標走的話,從左往右,角標同時想有移動,遇到相同字符則最長公共子序列+1。
兩個字符串角標分別是i,j,如果i=0,j=0,那麼我們可以知道s1[0]=s2[0],這時公共最長子序列有了字母a,那麼剩下需要判斷的則是 bcde 和 ce的公共最長子序列。
讓i,j同時+1明顯是不行的。
肉眼可以看到在剩下要判斷的字符串中 s[2]是"c" s[1]是"c"。
也就是如果讓i=i+1, j=j 是可以順利找到下一個相同字符的。可是我們計算機不知道。
假象另一種情況 ,如果兩個字符串是acbde afce,那麼 i=i, j=j+1就能讓我們找到下一個相同字符。
所以這裏要同時計算 i=i, j=j+1 和 i=i+1, j=j 看哪種情況最終返回的長度大。
圖解爲
明顯,這種算法效率爲O(2^N)
下面是編碼:
import static java.lang.Math.max;
public class LeetCode1143 {
public static int dp(String text1,String text2,int maxlen){
if(text1.charAt(0) == text2.charAt(0)){
String ttext1 = text1.substring(1,text1.length());
String ttext2= text2.substring(1,text2.length());
maxlen = maxlen + 1;
if(ttext1.length()>0 && ttext2.length()>0) {
return dp(ttext1, ttext2, maxlen);
}
}
else{
if(text1.length()>0 && text2.length()>0) {
String ttext1 = text1.substring( 1, text1.length());
String ttext2 = text2.substring(0, text2.length());
String ttext11 = text1.substring(0, text1.length());
String ttext22 = text2.substring(1, text2.length());
if(ttext1.length() == 0 && ttext22.length()>0){
return dp(ttext11, ttext22, maxlen);
}
if(ttext22.length() == 0 && ttext1.length() > 0 ){
return dp(ttext1, ttext2, maxlen);
}
if(ttext22.length() > 0 && ttext1.length() > 0) {
return max(dp(ttext11, ttext22, maxlen), dp(ttext1, ttext2, maxlen));
}
}
}
return maxlen;
}
public static int longestCommonSubsequence(String text1, String text2) {
int a = dp(text1,text2,0);
return a;
}
public static void main(String[] args){
// String s1 = "abcde";
//// String s2 = "ace";
String s1 = "pmjghexybyrgzczy";
String s2 ="hafcdqbgncrcbihkd";
int a = longestCommonSubsequence(s1,s2);
System.out.println(a);
}
}
以上代碼是可以找到正確答案的,但是由於是深度搜索的思路,效率非常差,提交後會顯示超時。
以上爲從左向右深度搜索所有情況,當找到兩個相同的字符時,最大長度+1,然後繼續向後按照各種情況查找。
優化後的算法,使用動態規劃提高效率
上述算法的缺點是,使用了深度優先搜索的思想,將所有查找方式都遍歷一遍才找到最大長度。
當找到兩個相同字符的時候,讓相同字符前的最大長度+1。
例如:
abcde
ace
當我找到c=c的時候,那麼最大長度應該是ab 與 a的最大子序列長度+1。
再例如,當我找到e=e的時候,那麼最大長度應該是abcd 與 ac的最大子序列長度+1。
也就有了這樣的模型。
有一個數組dp[][]
dp[i][j] 表示 s1的0~i 與s2的0~j 兩個子串的最長公共子序列。
那麼當 s[i]=s[j]的時候 dp[i][j]=dp[i-1][j-1]+1
當 s[i]<>s[j]的時候,那麼dp[i][j]的值若想要代表當天位置的最長子序列,我們把角標各自往前推一步,取較大的值。
dp[i][j]=max(dp[i-1][j],dp[i][j-1])
代碼實現:
package com.jinsong.leetcode;
public class LeetCode1143_ac {
public static int longestCommonSubsequence(String text1, String text2) {
int[][] dp = new int[text1.length()+1][text2.length()+1];
//表示text1[0~i] text2[0~j]的最大子序列長度
for(int i = 0 ;i<text1.length()+1;i++){
dp[i][0]=0;
}
for(int i = 0 ;i<text2.length()+1;i++){
dp[0][i]=0;
}
for(int i=0;i<text1.length();i++){
for(int j=0;j<text2.length();j++){
if(text1.charAt(i)==text2.charAt(j)){
dp[i+1][j+1]=dp[i][j]+1;
}
else{
dp[i+1][j+1]=java.lang.Math.max(dp[i][j+1],dp[i+1][j]);
}
}
}
return dp[text1.length()][text2.length()];
}
public static void main(String[] args){
String s1 = "pmjghexybyrgzczy";
String s2 = "hafcdqbgncrcbihkd";
int a = longestCommonSubsequence(s1,s2);
System.out.println(a);
}
}