kuangbin 專題十七 POJ2778(經典好題) AC自動機+矩陣快速冪

題意:
給出患病的DNA序列,問序列長度爲n的,且不包含患病的DNA序列有多少種。
題解:
這道題我是看別人做出來的,怎麼說呢,開拓了視野,也讓我知道AC自動還能這樣操作,也讓我更深入瞭解了矩陣的強大。
比如A(i,j)表示的是i->j,如果A*A表示的就是i到j要走兩步。具體怎麼回事可以看看這位博主:
http://blog.csdn.net/wt_cnyali/article/details/69803030

然後聽說這道題是Matrix67大神的十大經典矩陣的例題8,有興趣的朋友可以去看看:
www.matrix67.com/blog/archives/276

還有就是可以看看這位博主的畫圖和解釋:http://blog.csdn.net/morgan_xww/article/details/7834801

做這道題的話要將AC自動機的狀態圖抽象成點與點之間連接的有向圖。所以這道題與普通的AC自動機找fail指針是有點區別的,比如如果你的fail指針指向的地方是病毒序列那麼就說明你當前已經匹配的字符串肯定已經帶有病毒序列了,所以肯定也要標記爲病毒序列,就好像C爲病毒序列,你A不是病毒序列,但是你A匹配了C的話就變成AC,而C是病毒序列,就相當AC變成了病毒序列,需要標記。然後還有另外一步關鍵的點就是假如你temp沒有兒子節點的話就要補充完整,一個圖不能缺少點的信息,所以就要連接temp->fail指向的next[i]了,如果連失配指針都沒有的話就直接連接root得了,最關鍵的兩個點說了,再看回去看看我最後發的那個博主的圖你們應該能看明白了。然後就是建立矩陣,再矩陣快速冪的事情了,做矩陣快速冪最好開LL,因爲聽說這道題炸int。查看i與j是否爲病毒序列,如果兩個都不是的話,就連接上兩個節點,那麼整張圖就建立成功了。

#include<stdio.h>
#include<string.h>
#include<queue>
#include<algorithm>
using namespace std;
#define LL long long int
const int mod=100000;
struct Trie
{
    bool flag;
    int id;
    Trie *fail;
    Trie *next[4];
    Trie(){
        id=0;
        flag=false;
        fail=0;
        for(int i=0;i<4;i++)
        next[i]=0;
    }
}*root;
struct node
{
    LL m[105][105];
    node(){
        memset(m,0,sizeof(m));
    }
};
Trie *dfn[105];//存放Trie樹的節點地址。 
int tot;//tot一開始等於1是因爲root的id爲0. 
int check(char c)
{
    if(c=='A') return 0;
    else if(c=='G') return 1;
    else if(c=='T') return 2;
    else return 3;
}
void insert(char *s)
{
    Trie *r=root;
    for(int i=0;s[i];i++)
    {
        int x=check(s[i]);
        if(r->next[x]==0)
        {
            r->next[x]=new(Trie);
            r=r->next[x];
            r->id=tot;
            dfn[tot++]=r;
        }
        else
        r=r->next[x];
    }
    r->flag=true;
}
void getfail()//這裏要改點東西
{
    queue<Trie *>q;
    q.push(root);
    Trie *p;
    Trie *temp;
    while(!q.empty())
    {
        temp=q.front();
        q.pop();
        for(int i=0;i<4;i++)
        {
            if(temp->next[i])
            {
                if(temp==root)
                {
                    temp->next[i]->fail=root;
                }
                else
                {
                    p=temp->fail;
                    while(p)
                    {
                        if(p->next[i])
                        {
                            temp->next[i]->fail=p->next[i];
                            break;
                        }
                        p=p->fail;
                    }
                    if(p==0)
                    temp->next[i]->fail=root;
                }
                if(temp->next[i]->fail->flag)//兒子是危險串時,自己也應該爲危險串,就相當於C是危險字符串,AC中A不是危險的,但是匹配了C成爲了危險的。 
                temp->next[i]->flag=true;
                q.push(temp->next[i]);
            }
            else//這一步也是關鍵,相當於把空的節點補充完整,使每個子串都有兒子
            {
                if(temp->fail) temp->next[i]=temp->fail->next[i];
                else temp->next[i]=root;
            } 
        }
    }
}
node getMatrix()
{
    node A;
    for(int i=0;i<tot;i++)
    {
        for(int j=0;j<4;j++)
        if(!dfn[i]->flag&&!dfn[i]->next[j]->flag){
            A.m[dfn[i]->id][dfn[i]->next[j]->id]++;
            A.m[dfn[i]->id][dfn[i]->next[j]->id]%=mod;
        }
    }
    return A;
}
node cla(node A,node B)
{
    node C;
    for(int i=0;i<tot;i++)
        for(int j=0;j<tot;j++)
            for(int k=0;k<tot;k++)
            if(A.m[i][k]&&B.m[k][j])
            {
                C.m[i][j]+=A.m[i][k]*B.m[k][j];
                C.m[i][j]%=mod;
//              printf("%d %d %d\n",C.m[i][j],A.m[i][k],B.m[k][j]);
            }
    return C;       
} 
LL POW(node A,int k)
{
    node C;
    for(int i=0;i<tot;i++) C.m[i][i]=1;
    while(k)
    {
        if(k&1) C=cla(C,A);
        A=cla(A,A);
        k>>=1;
    }
    LL ans=0;
    for(int i=0;i<tot;i++)
    ans=(ans+C.m[0][i])%mod;
    return ans;
}
int main()
{
    int n,m;
    while(~scanf("%d%d",&n,&m))
    {
        root=new(Trie);
        tot=0;
        dfn[tot++]=root;
        char s[17];
        for(int i=0;i<n;i++)
        {
            scanf("%s",s);
            insert(s);
        }
        getfail();
        node A=getMatrix();
//      for(int i=0;i<tot;i++)
//      {
//          for(int j=0;j<tot;j++)
//          printf("%d ",A.m[i][j]);
//          printf("\n");
//      }
        LL ans=POW(A,m);
        printf("%d\n",ans);
    }
}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章