最长公共子序列(LCS)

    一个字符串S,去掉零个或者多个元素所剩下的子串称为S的子序列。最长公共子序列就是寻找两个给定序列的子序列,该子序列在两个序列中以相同的顺序出现,但是不必要是连续的。

    例如序列X=ABCBDAB,Y=BDCABA。序列BCA是X和Y的一个公共子序列,但是不是X和Y的最长公共子序列,子

序列BCBA是X和Y的一个LCS,序列BDAB也是。寻找LCS的一种方法是枚举X所有的子序列,然后注意检查是否是Y的子序

列,并随时记录发现的最长子序列。假设X有m个元素,则X有2^m个子序列,指数级的时间,对长序列不实际。

使用动态规划求解这个问题,先寻找最优子结构。设X=<x1,x2,…,xm>和Y=<y1,y2,…,yn>为两个序列,

LCS(X,Y)表示X和Y的一个最长公共子序列,可以看出

  1、如果xm=yn,则LCS ( X,Y ) = xm + LCS ( Xm-1,Yn-1 )。

  2、如果xm!=yn,则LCS( X,Y )= max{ LCS ( Xm-1, Y ), LCS ( X, Yn-1 ) }

   LCS问题也具有重叠子问题性质:为找出X和Y的一个LCS,可能需要找X和Yn-1的一个LCS以及Xm-1和Y的一个

LCS。但两个子问题都包含着找Xm-1和Yn-1的一个LCS,等等.DP最终处理的还是数值(极值做最优解),找到了最

优值,就找到了最优方案;为了找到最长的LCS,我们定义dp[i][j]记录序列LCS的长度,合法状态的初始值为当序列

X的长度为0或Y的长度为0,公共子序列LCS长度为0,即dp[i][j]=0,所以用i和j分别表示序列X的长度和序列Y的长

,状态转移方程为

  1. dp[i][j] = 0  如果i=0或j=0
  2. dp[i][j] = dp[i-1][j-1] + 1  如果X[i-1] = Y[i-1]
  3. dp[i][j] = max{ dp[i-1][j], dp[i][j-1] }  如果X[i-1] != Y[i-1]

求出了最长公共子序列的长度后,输出LCS就是输出dp的最优方案了,既可以用一个额外的矩阵存储路径,也可以直

接根据状态转移矩阵倒推最优方案。代码如下:


import java.util.Random;
/*
 * 最长公共子序列
 */
public class LCS{  
	char[][] b;
	int[][] c;
    public static void main(String[] args){  
   
        //设置字符串长度  
        int substringLength1 = 10;  
        int substringLength2 = 15;  //具体大小可自行设置  
   
        // 随机生成字符串  
        String x = GetRandomStrings(substringLength1);  
        String y = GetRandomStrings(substringLength2);  
   
        Long startTime = System.nanoTime();  
        // 构造二维数组记录子问题x[i]和y[i]的LCS的长度  
      
        System.out.println("substring1:"+x);  
        System.out.println("substring2:"+y);  
        x=" "+x;
        y=" "+y;
        LCS lcs=new LCS();
        lcs.lcsLength(x, y);
        lcs.printLcs(x, x.length()-1, y.length()-1);
    }  
  public void lcsLength(String x,String y){
	   int m=x.length();
	   int n=y.length();
	   b=new char[m][n];
	   c=new int[m+1][n+1];
	   for(int i=1;i<m+1;i++){
		   c[i][0]=0;
	   }
	   for(int i=0;i<m+1;i++){
		   c[0][i]=0;
	   }
	   for(int i=1;i<m;i++){
		   for(int j=1;j<n;j++){
			   if(x.charAt(i)==y.charAt(j)){
				   c[i][j]=c[i-1][j-1]+1;
				   b[i][j]='m';
			   }else if(c[i-1][j]>=c[i][j-1]){
				   c[i][j]=c[i-1][j];
				   b[i][j]='t';
			   }else {
				   c[i][j]=c[i][j-1];
				   b[i][j]='r';
			   }
			   
		   }
	   }
	   
   }
   
   public void printLcs(String x,int i,int j){
	   if(i==0||j==0)
		   return;
	   if(b[i][j]=='m'){
		   printLcs(x, i-1, j-1);
		   System.out.print(x.charAt(i));
	   }else if(b[i][j]=='t')
		   printLcs(x, i-1, j);
	   else
		   printLcs(x, i, j-1);
	   
   }
    //取得定长随机字符串  
    public static String GetRandomStrings(int length){  
        StringBuffer buffer = new StringBuffer("abcdefghijklmnopqrstuvwxyz");  
        StringBuffer sb = new StringBuffer();  
        Random r = new Random();  
        int range = buffer.length();  
        for (int i = 0; i < length; i++){  
            sb.append(buffer.charAt(r.nextInt(range)));  
        }  
        return sb.toString();  
    }  
}  


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章