最長公共子序列(LCS)

一個字符串S,去掉零個或者多個元素所剩下的子串稱爲S的子序列。最長公共子序列就是尋找兩個給定序列的子序列,該子序列在兩個序列中以相同的順序出現,但是不必要是連續的。

例如序列X=ABCBDAB,Y=BDCABA。序列BCA是X和Y的一個公共子序列,但是不是X和Y的最長公共子序列,子序列BCBA是X和Y的一個LCS,序列BDAB也是。尋找LCS的一種方法是枚舉X所有的子序列,然後注意檢查是否是Y的子序列,並隨時記錄發現的最長子序列。假設X有m個元素,則X有2^m個子序列,指數級的時間,對長序列不實際。

使用動態規劃求解這個問題,先尋找最優子結構。設X=<x1,x2,…,xm>和Y=<y1,y2,…,yn>爲兩個序列,

LCS(X,Y)表示X和Y的一個最長公共子序列,可以看出

1、如果xm=yn,則LCS ( X,Y ) = xm + LCS ( Xm-1,Yn-1 )。

2、如果xm!=yn,則LCS( X,Y )= max{ LCS ( Xm-1, Y ), LCS ( X, Yn-1 ) }

LCS問題也具有重疊子問題性質:爲找出X和Y的一個LCS,可能需要找X和Yn-1的一個LCS以及Xm-1和Y的一個LCS。但這兩個子問題都包含着找Xm-1和Yn-1的一個LCS,等等.DP最終處理的還是數值(極值做最優解),找到了最優值,就找到了最優方案;爲了找到最長的LCS,我們定義dp[i][j]記錄序列LCS的長度,合法狀態的初始值爲當序列X的長度爲0或Y的長度爲0,公共子序列LCS長度爲0,即dp[i][j]=0,所以用i和j分別表示序列X的長度和序列Y的長度,狀態轉移方程爲

dp[i][j] = 0 如果i=0或j=0
dp[i][j] = dp[i-1][j-1] + 1 如果X[i-1] = Y[i-1]
dp[i][j] = max{ dp[i-1][j], dp[i][j-1] } 如果X[i-1] != Y[i-1]

求出了最長公共子序列的長度後,輸出LCS就是輸出dp的最優方案了,既可以用一個額外的矩陣存儲路徑,也可以直接根據狀態轉移矩陣倒推最優方案。

代碼如下:

import java.util.Random;
/*
 * 最長公共子序列
 */
public class LCS{  
    char[][] b;
    int[][] c;
    public static void main(String[] args){  

        //設置字符串長度  
        int substringLength1 = 10;  
        int substringLength2 = 15;  //具體大小可自行設置  

        // 隨機生成字符串  
        String x = GetRandomStrings(substringLength1);  
        String y = GetRandomStrings(substringLength2);  

        Long startTime = System.nanoTime();  
        // 構造二維數組記錄子問題x[i]和y[i]的LCS的長度  

        System.out.println("substring1:"+x);  
        System.out.println("substring2:"+y);  
        x=" "+x;
        y=" "+y;
        LCS lcs=new LCS();
        lcs.lcsLength(x, y);
        lcs.printLcs(x, x.length()-1, y.length()-1);
    }  
  public void lcsLength(String x,String y){
       int m=x.length();
       int n=y.length();
       b=new char[m][n];
       c=new int[m+1][n+1];
       for(int i=1;i<m+1;i++){
           c[i][0]=0;
       }
       for(int i=0;i<m+1;i++){
           c[0][i]=0;
       }
       for(int i=1;i<m;i++){
           for(int j=1;j<n;j++){
               if(x.charAt(i)==y.charAt(j)){
                   c[i][j]=c[i-1][j-1]+1;
                   b[i][j]='m';
               }else if(c[i-1][j]>=c[i][j-1]){
                   c[i][j]=c[i-1][j];
                   b[i][j]='t';
               }else {
                   c[i][j]=c[i][j-1];
                   b[i][j]='r';
               }

           }
       }

   }

   public void printLcs(String x,int i,int j){
       if(i==0||j==0)
           return;
       if(b[i][j]=='m'){
           printLcs(x, i-1, j-1);
           System.out.print(x.charAt(i));
       }else if(b[i][j]=='t')
           printLcs(x, i-1, j);
       else
           printLcs(x, i, j-1);

   }
    //取得定長隨機字符串  
    public static String GetRandomStrings(int length){  
        StringBuffer buffer = new StringBuffer("abcdefghijklmnopqrstuvwxyz");  
        StringBuffer sb = new StringBuffer();  
        Random r = new Random();  
        int range = buffer.length();  
        for (int i = 0; i < length; i++){  
            sb.append(buffer.charAt(r.nextInt(range)));  
        }  
        return sb.toString();  
    }  
}  
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章