AC自動機+矩陣快速冪 POJ 2778

題意:有m種DNA序列是有疾病的,問有多少種長度爲n的DNA序列不包含任何一種有疾病的DNA序列。(僅含A,T,C,G四個字符)

首先我們需要知道

給定一個有向圖,問從A點恰好走k步(允許重複經過邊)到達B點的方案數mod p的值

把給定的圖轉爲鄰接矩陣,即A(i,j)=1當且僅當存在一條邊i->j。令C=A*A,那麼C(i,j)=ΣA(i,k)*A(k,j),實際上就等於從點i到點j恰好經過2條邊的路徑數(枚舉k爲中轉點)。類似地,C*A的第i行第j列就表示從i到j經過3條邊的路徑數。同理,如果要求經過k步的路徑數,我們只需要求出A^k即可。

其次

對於有疾病的序列,我們可以標記下來最後一個節點,需要注意的是,對於一個節點,如果其fail指針指向的是標記節點,那麼這個節點也要被標記,因爲fail指向的序列一定是當前序列的後綴。標記完後,開始建鄰接矩陣,凡是以標記節點作爲結尾的邊權值都爲0(不允許到達)。

最後 

對於得到的鄰接矩陣跑矩陣快速冪然後統計從根節點到每一個節點的種數之和。

#include <cmath>
#include <queue>
#include <cstdio>
#include <cstring>
#include <cstdlib>
#include <iostream>
#include <algorithm>
#define LL long long
#define INF 0x3f3f3f3f
using namespace std;
const int maxn = 15;
const int mod = 1e5;
int m,k;char str[15];
struct matrix{LL a[111][111];}X;
int ch(char c)
{
    if(c=='A') return 0;if(c=='C') return 1;
    if(c=='G') return 2;if(c=='T') return 3;
}
struct Trie
{
    int next[111][4],fail[111],end[111];
    int root,L;
    int newnode()
    {
        for(int i = 0;i < 4;i++)
            next[L][i] = -1;
        end[L++] = 0;
        return L-1;
    }
    void init(){L = 0;root = newnode();}
    void insert(char buf[])
    {
        int len = strlen(buf);
        int now = root;
        for(int i = 0;i < len;i++)
        {
            if(next[now][ch(buf[i])] == -1)
                next[now][ch(buf[i])] = newnode();
            now = next[now][ch(buf[i])];
        }
        end[now]=1;
    }
    void build()
    {
        queue<int>Q;
        fail[root] = root;
        for(int i = 0;i < 4;i++)
            if(next[root][i] == -1)
                next[root][i] = root;
            else
            {
                fail[next[root][i]] = root;
                Q.push(next[root][i]);
            }
        while( !Q.empty() )
        {
            int now = Q.front();
            Q.pop();
            if(end[fail[now]])
                end[now]=1;
            for(int i = 0;i < 4;i++)
                if(next[now][i] == -1)
                    next[now][i] = next[fail[now]][i];
                else
                {
                    fail[next[now][i]]=next[fail[now]][i];
                    Q.push(next[now][i]);
                }
        }
    }
}ac;
matrix multi(matrix A,matrix B)
{
    matrix C;int n = ac.L;
    memset(C.a,0,sizeof(C.a));
    int i,j,k;
    for(i=0;i<n;i++)
        for(j=0;j<n;j++)
        {
            for(k=0;k<n;k++)
                C.a[i][j] += A.a[i][k]*B.a[k][j];
            C.a[i][j] %= mod;
        }
    return C;
}
matrix quickly(matrix A,int k)
{
    matrix ans;
    memset(ans.a,0,sizeof(ans.a));
    for(int i=0;i<ac.L;i++)
        ans.a[i][i]=1;
    while(k)
    {
        if(k & 1) ans = multi(A,ans);
        A = multi(A,A);
        k>>=1;
    }
    return ans;
}
matrix getmatrix(matrix A)
{
    memset(A.a,0,sizeof(A));
    for(int i=0;i<ac.L;i++)
        for(int j=0;j<4;j++)
            if(!ac.end[ac.next[i][j]])
                A.a[i][ac.next[i][j]]++;
    return A;
}
int main()
{
    int i;
    while(~scanf("%d%d",&m,&k))
    {
        ac.init();
        for(i=1;i<=m;i++)
        {
            scanf("%s",str);
            ac.insert(str);
        }
        ac.build();
        X = getmatrix(X);
        X = quickly(X,k);
        LL ans = 0;
        for(i=0;i<ac.L;i++) ans = (ans + X.a[0][i])%mod;
        printf("%lld\n",ans);
    }
    return 0;
}



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章