動態規劃之最長公共子序列和最長公共子串

 給定兩個字符串,求解這兩個字符串的最長公共子序列
 比如字符串1:ABCD;字符串2:AEBD
則這兩個字符串的最長公共子序列長度爲3,最長公共子序列是:ABD

 什麼是公共子序列?請看下圖

對於dp[m[n]代表str1[0,1,2...m]和str2[0,1,2...n]的最長公共子序列的長度

①如果str1[m]!=str2[n]那麼兩個字符串的最後一個字符都不可能是公共子序列的一部分,那麼最長子序列只能從(str1[0,1,2...(m-1)]和str2[0,1,2...n])或者(str1[0,1,2...m]和str2[0,1,2...(n-1)])取最長的即dp[m][n]=max(dp[m][n-1],dp[m-1][n])

②如果str1[m]==str2[n]那麼兩個字符串的最後一個字符是公共子序列的一部分dp[m[n]=dp[m-1][n-1]+1

 

	public static int[][] getdp(char[] str1, char[] str2) {
		int[][] dp = new int[str1.length][str2.length];
		dp[0][0] = str1[0] == str2[0] ? 1 : 0;
		for (int m = 1; m < str1.length; m++) {
			dp[m][0] = Math.max(dp[m - 1][0], str1[m] == str2[0] ? 1 : 0);
		}
		for (int n = 1; n < str2.length; n++) {
			dp[0][n] = Math.max(dp[0][n - 1], str1[0] == str2[n] ? 1 : 0);
		}
		for (int m = 1; m < str1.length; m++) {
			for (int n = 1; n < str2.length; n++) {
				dp[m][n] = Math.max(dp[m - 1][n], dp[m][n - 1]);
				if (str1[m] == str2[n]) {
					dp[m][n] = Math.max(dp[m][n], dp[m - 1][n - 1] + 1);
				}
			}
		}
		return dp;
	}

①分別用m和n在while循環裏標記兩個字符串對應的下標。

②index代表公共子序列的下標

只有dp[m[n]=dp[m-1][n-1]+1時的字符才需要記錄,其餘的都略過(dp[m[n]=dp[m-1][n]以及dp[m[n]=dp[m][n-1]的情況)

	public static String lcse(String str1, String str2) {
		if (str1 == null || str2 == null || str1.equals("") || str2.equals("")) {
			return "";
		}
		char[] chs1 = str1.toCharArray();
		char[] chs2 = str2.toCharArray();
		int[][] dp = getdp(chs1, chs2);
		int m = chs1.length - 1;
		int n = chs2.length - 1;
		char[] res = new char[dp[m][n]];
		int index = res.length - 1;
		while (index >= 0) {
			if (n > 0 && dp[m][n] == dp[m][n - 1]) {
				n--;
			} else if (m > 0 && dp[m][n] == dp[m - 1][n]) {
				m--;
			} else {
				res[index--] = chs1[m];
				m--;
				n--;
			}
		}
		return String.valueOf(res);
	}

 

問題變形:

問題:有兩個字符串str和str2,求出兩個字符串中最長公共子串長度。

比如:str=acbcbcef,str2=abcbced,則str和str2的最長公共子串爲bcbce,最長公共子串長度爲5。

求最長公共子串遞推式爲

dp[m][n]代表必須把str1[m],str2[n]作爲結束字符時的最公共長子串的長度

①str1[m]==str2[n] 時 dp[m][n]=dp[m-1][n-1]+1

②str1[m]!=str2[n] 時 dp[m][n]= 0

求公共子串時end代表子串的結束位置,max代表子串長度·

public class  LCSubstring {

	public static String lcst1(String str1, String str2) {
		if (str1 == null || str2 == null || str1.equals("") || str2.equals("")) {
			return "";
		}
		char[] chs1 = str1.toCharArray();
		char[] chs2 = str2.toCharArray();
		int[][] dp = getdp(chs1, chs2);
		int end = 0;
		int max = 0;
		for (int i = 0; i < chs1.length; i++) {
			for (int j = 0; j < chs2.length; j++) {
				if (dp[i][j] > max) {
					end = i;
					max = dp[i][j];
				}
			}
		}
		return str1.substring(end - max + 1, end + 1);
	}

	public static int[][] getdp(char[] str1, char[] str2) {
		int[][] dp = new int[str1.length][str2.length];
		for (int i = 0; i < str1.length; i++) {
			if (str1[i] == str2[0]) {
				dp[i][0] = 1;
			}
		}
		for (int j = 1; j < str2.length; j++) {
			if (str1[0] == str2[j]) {
				dp[0][j] = 1;
			}
		}
		for (int i = 1; i < str1.length; i++) {
			for (int j = 1; j < str2.length; j++) {
				if (str1[i] == str2[j]) {
					dp[i][j] = dp[i - 1][j - 1] + 1;
				}
			}
		}
		return dp;
	}


	public static void main(String[] args) {
		String str1 = "ABC1234567DEFG";
		String str2 = "HIJKL1234567MNOP";
		System.out.println(lcst1(str1, str2));
		System.out.println(lcst2(str1, str2));

	}

}

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章