BZOJ 3992 SDOI2015 序列統計

此文章寫給沒有學過FFT, FNT的小夥伴看 , 神犇繞行QAQ

博主在沒有善良學長的情況下 , 花了一天學習了快速傅立葉變換(FFT)和快速數論變換(FNT)(其實差不多啦…… )分享一下學習過程 , 如果哪位小夥伴也沒有學長幫助 , 可以借鑑啦……

你需要把我的文字部分簡略看一遍 , 再來看各個博客 , 這樣會更有方向性。
分享一個博客Miskcoo’s這個小夥伴的前提知識寫的很清楚 , 當你讀到IDFT的時候可能有疑惑 , 此時你只需要暫時記住(等會來填坑) , IDFT和DFT的過程是相似的其它先不管 , 然後繼續看迭代版本的DFT過程。 此時 , 你可以對着Rujia的代碼看看 , 如下:

// Cooley-Tukey的FFT算法,迭代實現。inverse = false時計算逆FFT
inline void FFT(vector<CD> &a, bool inverse) {
  int n = a.size();
  // 原地快速bit reversal
  for(int i = 0, j = 0; i < n; i++) {
    if(j > i) swap(a[i], a[j]);
    int k = n;
    while(j & (k >>= 1)) j &= ~k;
    j |= k;
  }

  double pi = inverse ? -PI : PI;
  for(int step = 1; step < n; step <<= 1) {
    // 把每相鄰兩個“step點DFT”通過一系列蝴蝶操作合併爲一個“2*step點DFT”
    double alpha = pi / step;
    // 爲求高效,我們並不是依次執行各個完整的DFT合併,而是枚舉下標k
    // 對於一個下標k,執行所有DFT合併中該下標對應的蝴蝶操作,即通過E[k]和O[k]計算X[k]
    // 蝴蝶操作參考:http://en.wikipedia.org/wiki/Butterfly_diagram
    for(int k = 0; k < step; k++) {
      // 計算omega^k. 這個方法效率低,但如果用每次乘omega的方法遞推會有精度問題。
      // 有更快更精確的遞推方法,爲了清晰起見這裏略去
      CD omegak = exp(CD(0, alpha*k)); 
      for(int Ek = k; Ek < n; Ek += step << 1) { // Ek是某次DFT合併中E[k]在原始序列中的下標
        int Ok = Ek + step; // Ok是該DFT合併中O[k]在原始序列中的下標
        CD t = omegak * a[Ok]; // 蝴蝶操作:x1 * omega^k
        a[Ok] = a[Ek] - t;  // 蝴蝶操作:y1 = x0 - t
        a[Ek] += t;         // 蝴蝶操作:y0 = x0 + t
      }
    }
  }

  if(inverse)
    for(int i = 0; i < n; i++) a[i] /= n;
}

// 用FFT實現的快速多項式乘法
inline vector<double> operator * (const vector<double>& v1, const vector<double>& v2) {
  int s1 = v1.size(), s2 = v2.size(), S = 2;
  while(S < s1 + s2) S <<= 1;
  vector<CD> a(S,0), b(S,0); // 把FFT的輸入長度補成2的冪,不小於v1和v2的長度之和
  for(int i = 0; i < s1; i++) a[i] = v1[i];
  FFT(a, false);
  for(int i = 0; i < s2; i++) b[i] = v2[i];
  FFT(b, false);
  for(int i = 0; i < S; i++) a[i] *= b[i];
  FFT(a, true);
  vector<double> res(s1 + s2 - 1);
  for(int i = 0; i < s1 + s2 - 1; i++) res[i] = a[i].real(); // 虛部均爲0
  return res;
}

你可能覺得分治有點不好理解 , 其實分治的對象就是ωkn 的函數值,k[0,n) , 總體來說就是我們一步步把這玩意二分成若干小塊 , 每一塊相同位置的ω 的下標在那一層分治中都是相同的(但是此時係數並不相同) , 分治後的每一次更新就是把相鄰兩塊同一位置的kn2+k 拿出來 , 交替更新(就是蝴蝶神馬的)。

分治的前提是每次分裂後的那些奇偶係數都在一塊 , 所以我們需要對這個序列進行重排(就是把二進制位倒過來 , 10110 變成01101 )至於每個數怎麼算它倒過來在哪裏 , 這個問題Rujia代碼是比較優秀的 , 其實就是記錄上一個數倒過來的數是神馬 , 然後在首位加一個1 然後類似於進位一樣的推到後面來。 誒 , 你可能覺得這玩意怎麼分治到最後沒有邊界啊 , 其實邊界就是數組本身 , 因爲ω01==1 , 所以ω01×a[i]==a[i]

好 , 再來填坑 , 看剛剛那個博客 , 你會發現從矩陣的角度上來看 , IDFT和DFT長得差不多 , 其實就是把所有的正負號取反就可以得到一個這玩意的逆矩陣的n 倍(千萬不要以爲是把矩陣元素值取反 , 實際上這個過程更像是除法)。 然而IDFT其實只用在FFT函數中上加一個標記就行啦。

再來兩篇博客 , 這裏面有模版題 , ACdreamer’s1 , ACdreamer’s2

最後想說FFT的想法真的很奇妙 , 雖然本人並沒有實質上的優化算法 , 但這個想法打開了一扇門:-)

再說說本題:
首先 , 此題是一個DP題 , Vincent’s裏說的很詳細。不得不說這個小夥伴的代碼常數巨大……

補充幾點:
如果你只想拿60個點 , 那麼你不需要學FNT , 直接把n 快速冪算就可以啦。 FNT其實就是加速m2 這個過程 , 爲了能夠FNT , 我們需要求此m 的原根 , 注意區分兩個原根。 這樣整個表達式長的就像卷積形式啦……然後就可以AC了

#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <cmath>
#include <string>
#include <vector>
#include <deque>
#include <stack>
#include <queue>
#include <set>
#include <map>
#include <algorithm>
#include <cassert>

using namespace std;
typedef long long ll;
typedef vector<ll> vl;
const int maxm = 8100;
const int modu = 1004535809;

int n , m , x , s;
int a[maxm] , b[maxm];

ll powerMod(ll a , ll n , ll p)
{
    if(!n) return 1;
    ll res = powerMod(a, n/2, p);
    res = (res * res)%p;
    if(n&1) res = (res * a)%p;
    return (res+p)%p;
}

bool judge(int p , int a)
{
    int pp = p;
    for(int i=2;i*i<=p;i++) if(pp%i==0)
    {
        if(powerMod(a, p/i, p+1)==1) return false;
        while(pp%i==0) pp/=i; 
    }
    if(pp!=1 && powerMod(a, p/pp, p+1)==1) return false;
    return true;
}

int findRoot(int p)
{
    for(int i=2;;i++) if(judge(p-1, i)) return i;
}

void exGcd(ll a , ll b , ll& d , ll& x , ll& y)
{
    if(!b) x = 1 , y = 0 , d = a;
    else 
    {
        exGcd(b, a%b, d, y, x);
        y -= a/b*x;
    }
}

ll rev(ll a , ll p)
{
    ll x , y , d;
    exGcd(a, p, d, x, y);
    return x;
}

namespace FNT
{
    void FNTprocess(vl& a , bool rever = false)
    {
        int n = a.size();
        for(int i=0,j=0;i<n;i++)
        {
            if(j > i) swap(a[i], a[j]);
            int k = n;
            while(j & (k >>= 1)) j &= ~k;
            j |= k;
        }

        for(int step=1;step<n;step <<= 1)
        {
            ll wn = powerMod(3, (modu-1)/step/2, modu) , w = 1;
            if(rever) wn = rev(wn, modu);
            for(int k=0;k<step;k++)
            {
                for(int i=k,j;i<n;i+= step << 1)
                {
                    j = i+step;
                    ll now = (w*a[j])%modu;
                    a[j] = (a[i] - now)%modu;
                    a[i] = (a[i] + now)%modu;
                }
                w = (w*wn)%modu;
            }
        }
        int r = rev(n, modu);
        if(rever) for(int i=0;i<n;i++) a[i] *= r , a[i]%=modu;
    }

    vl operator *(vl x , vl y)
    {
        int s1 = x.size() , s2 = y.size() , s = 2;
        while(s < s1 + s2) s <<= 1;

        vl a(s) , b(s);
        for(int i=0;i<s1;i++) a[i] = x[i];
        FNTprocess(a);
        for(int i=0;i<s2;i++) b[i] = y[i];
        FNTprocess(b);
        for(int i=0;i<s;i++) a[i] *= b[i] , a[i] %= modu;
        FNTprocess(a , true);

        vl c(s1 , 0);
        for(int i=0;i<s;i++) c[i%s1] += a[i] , c[i%s1]%=modu;
        return c;
    }
}

using namespace FNT;

vl powerV(vl a , int n)
{
    if(n==1) return a;
    vl res = powerV(a, n/2);
    res = res*res;
    if(n&1) res = (res * a);
    return res;
}


int main(int argc, char *argv[]) {

    cin>>n>>m>>x>>s;

    int r = findRoot(m) , now = 1;

    for(int i=0;i<m-1;i++)
    {
        b[now] = i;
        now = (now * r)%m;
    }

    for(int i=0;i<s;i++) 
    {
        int v;
        scanf("%d" , &v);
        if(!v) continue;
        a[b[v%m]]++;
    }

    vl res , hi;
    for(int i=0;i<m-1;i++) res.push_back(a[i]);
    res = powerV(res, n);

    printf("%lld\n" , (res[b[x]]+modu)%modu);

    return 0;
}

最後附上TestData7:

Inputs:

152638504 5981 5475 3035


Outputs:

808995810
發佈了99 篇原創文章 · 獲贊 13 · 訪問量 10萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章