學一發分治FFT求多項式exp
感覺這種打法應該比牛頓迭代好打多了
#include <cstdio>
#include <iostream>
#include <algorithm>
using namespace std;
const int N=1000010,P=998244353;
inline void add(int &x,int y){
x+y>=P?x=x+y-P:x=x+y;
}
int num,n,m,a[N],b[N],cnt[N],p[N],expp[N],inv[N];
int w[2][N],rev[N];
inline int Pow(int x,int y){
int ret=1;
for(;y;y>>=1,x=1LL*x*x%P) if(y&1) ret=1LL*ret*x%P;
return ret;
}
inline void Pre(const int &n){
num=n; int g=Pow(3,(P-1)/num);
w[0][0]=w[1][0]=1;
for(int i=1;i<num;i++) w[1][i]=1LL*w[1][i-1]*g%P;
for(int i=1;i<num;i++) w[0][i]=w[1][n-i];
inv[1]=1; for(int i=2;i<=num;i++) inv[i]=1LL*(P-P/i)*inv[P%i]%P;
}
inline void NTT(int *a,int n,int r){
for(int i=1;i<n;i++) if(rev[i]>i) swap(a[i],a[rev[i]]);
for(int i=1;i<n;i<<=1)
for(int j=0;j<n;j+=(i<<1))
for(int k=0;k<i;k++){
int x=a[j+k],y=1LL*a[j+k+i]*w[r][num/(i<<1)*k]%P;
a[j+k]=(x+y)%P; a[j+k+i]=(x+P-y)%P;
}
if(!r) for(int i=0,iv=inv[n];i<n;i++) a[i]=1LL*a[i]*iv%P;
}
void exp(int *a,int *b,int l,int r){
if(l==r){
add(b[l],1LL*inv[l]*a[l]%P); return ;
}
int mid=l+r>>1;
exp(a,b,l,mid);
static int tmpa[N],tmpb[N];
for(int i=l;i<=mid;i++) tmpa[i-l]=b[i];
for(int i=1;i<=r-l;i++) tmpb[i]=a[i];
int m,L=0;
for(m=1;m<r-l+1;m<<=1,L++); m<<=1;
for(int i=1;i<m;i++) rev[i]=(rev[i>>1]>>1)|((i&1)<<L);
NTT(tmpa,m,1); NTT(tmpb,m,1);
for(int i=0;i<m;i++) tmpa[i]=1LL*tmpa[i]*tmpb[i]%P;
NTT(tmpa,m,0);
for(int i=mid+1;i<=r;i++) add(b[i],1LL*inv[i]*tmpa[i-l]%P);
for(int i=0;i<m;i++) tmpa[i]=tmpb[i]=0;
exp(a,b,mid+1,r);
}
int main(){
freopen("1.in","r",stdin);
freopen("1.out","w",stdout);
scanf("%d%d",&n,&m);
int _m; for(_m=1;_m<=n;_m<<=1); Pre(_m<<=1);
for(int i=1;i<=m;i++){
scanf("%d%d",&a[i],&b[i]);
add(cnt[a[i]],1);
if(b[i] && 1LL*a[i]*(b[i]+1)<=n)
add(cnt[a[i]*(b[i]+1)],P-1);
}
for(int i=1;i<=n;i++){
if(!cnt[i]) continue;
for(int j=1;i*j<=n;j++)
add(p[i*j],1LL*cnt[i]*inv[j]%P);
}
for(int i=1;i<=n;i++) p[i]=1LL*p[i]*i%P;
exp(p,expp,1,n);
for(int i=1;i<=n;i++) printf("%d\n",expp[i]);
return 0;
}