Address
Algorithm 1
考虑每次取出区间中 的最小值建出笛卡尔树,令每个结点表示一个区间,从叶子结点往上 DP。
考虑对每个区间内的所有列分类,设当前处理的高度为 :
- 在高度大于 的某个位置存在一个
车
,现在可以任意填放车
; - 在高度大于 的所有位置都不存在
车
,但这些位置都被其它车
覆盖; - 在高度大于 的所有位置都不存在
车
,且这些位置中存在至少一个位置没有被其它车
覆盖。
设 表示在结点 有 个 1 类列、 个 2 类列的方案数,两个子区间的方案显然可以直接合并。
依次考虑结点 自身所包含的每个行连续段 车
的放置方案,设区间长度为 ,容易得到如下转移:
- 不放置任何
车
:
- 只在 1 类列放置
车
:
- 在 2 类列和 3 类列放置任意数量(至少为 )的
车
,此时 1 类列可以任意放置车
:
直接实现是 的,考虑优化状态。
注意到如果我们假定接下来填的每一行都至少有一个 车
,那么所有 2 类列都可以看做 1 类列,否则都可以看做 3 类列。
于是我们可以在状态中额外记录一维 表示接下来填的每一行是否都至少有一个 车
,就可以把 2 类列的数量并到 1 类列或者 3 类列中去。
类似地得到所有转移,时间复杂度 。
Code 1
#include <bits/stdc++.h>
const int N = 1e4 + 5;
const int mod = 998244353;
int len[N], c[N][N], ex[N], f[N][N], g[N][N], tf[N], tg[N], h[N];
int n, T, rt;
inline void add(int &x, int y)
{
x += y;
x >= mod ? x -= mod : 0;
}
inline void dec(int &x, int y)
{
x -= y;
x < 0 ? x += mod : 0;
}
inline void Update(int now, int x)
{
for (int i = 0; i <= len[x] + len[now]; ++i)
tf[i] = tg[i] = 0;
for (int i = 0; i <= len[x]; ++i)
for (int j = 0; j <= len[now]; ++j)
{
tf[i + j] = (1ll * f[x][i] * f[now][j] + tf[i + j]) % mod;
tg[i + j] = (1ll * g[x][i] * g[now][j] + tg[i + j]) % mod;
}
len[now] += len[x];
for (int i = 0; i <= len[now]; ++i)
f[now][i] = tf[i], g[now][i] = tg[i];
}
inline int solve(int l, int r, int lst)
{
if (l > r)
return 0;
int mid = l, now = ++T;
for (int i = l + 1; i <= r; ++i)
if (h[i] < h[mid])
mid = i;
int lc = solve(l, mid - 1, h[mid]),
rc = solve(mid + 1, r, h[mid]);
f[now][0] = g[now][0] = len[now] = 1;
if (lc)
Update(now, lc);
if (rc)
Update(now, rc);
int _len = len[now];
for (int i = 1; i <= h[mid] - lst; ++i)
{
for (int j = 0; j <= _len; ++j)
tf[j] = tg[j] = 0;
if (i == 1)
{
int delta = 0;
for (int j = l; j <= r; ++j)
if (h[j] == h[mid])
++delta;
_len -= delta;
for (int j = 0; j <= _len; ++j)
{
tf[j + delta] = (1ll * f[now][j] * (ex[j] - 1) + tf[j + delta]) % mod;
tg[j] = (1ll * g[now][j] * (ex[j] - 1) + tg[j]) % mod;
add(tf[j], g[now][j]);
add(tg[j], g[now][j]);
for (int a = 0; j + a <= _len; ++a)
for (int b = 0; b <= delta; ++b)
if (a + b > 0)
{
int tmp = 1ll * c[_len - j][a] * c[delta][b] % mod * ex[j] % mod;
tf[j + a + delta] = (1ll * tmp * f[now][j] + tf[j + a + delta]) % mod;
tg[j + a + b] = (1ll * tmp * g[now][j] + tg[j + a + b]) % mod;
}
}
_len += delta;
}
else
{
for (int j = 0; j <= _len; ++j)
{
tf[j] = (1ll * f[now][j] * (ex[j] - 1) + tf[j]) % mod;
tg[j] = (1ll * g[now][j] * (ex[j] - 1) + tg[j]) % mod;
add(tf[j], g[now][j]);
add(tg[j], g[now][j]);
for (int k = 1; j + k <= _len; ++k)
{
tf[j + k] = (1ll * f[now][j] * c[_len - j][k] % mod * ex[j] + tf[j + k]) % mod;
tg[j + k] = (1ll * g[now][j] * c[_len - j][k] % mod * ex[j] + tg[j + k]) % mod;
}
}
}
for (int j = 0; j <= _len; ++j)
f[now][j] = tf[j], g[now][j] = tg[j];
}
return now;
}
int main()
{
scanf("%d", &n);
for (int i = 1; i <= n; ++i)
scanf("%d", &h[i]);
ex[0] = 1;
for (int i = 1; i <= n; ++i)
add(ex[i] = ex[i - 1], ex[i - 1]);
c[0][0] = 1;
for (int i = 1; i <= n; ++i)
{
c[i][0] = 1;
for (int j = 1; j <= i; ++j)
add(c[i][j] = c[i - 1][j - 1], c[i - 1][j]);
}
rt = solve(1, n, 0);
printf("%d\n", f[rt][n]);
return 0;
}
Algorithm 2
考虑容斥,即钦定若干个方格没有被 车
覆盖,求出此时的方案数,容斥系数为 。
注意到如果一个方格被钦定,方格所在的列一定没有 车
。
于是我们在状态中记录钦定没有 车
的列的数量,设 表示在结点 共有 列钦定没有 车
的容斥系数乘上方案数的和。
两个子区间的合并只需要考虑中间新增的那一列是否被钦定即可。
对于填每个行连续段的情况,我们同样进行一些讨论,设区间长度为 ,共有 列钦定没有 车
:
- 若连续段中没有选择任何一个方格钦定没有被
车
覆盖,方案数为 ; - 若连续段中选择了一些方格钦定没有被
车
覆盖,连续段中不能再填车
,容斥系数和为 。
因此转移前的系数和为 。
但这样做是有一些问题的,因为我们无法保证钦定的列中都有方格被选。
考虑再次容斥,我们钦定有 列在第一次钦定后没有方格被选,容斥系数为 。
那么只有第二种情况的系数和变为了 ,总的系数和为 。
因此我们并不关心 的取值,只需要在状态中额外记录一维表示 是否等于 即可。
时间复杂度 。
Code 2
#include <bits/stdc++.h>
const int N = 1e4 + 5;
const int mod = 998244353;
int len[N], ex[N], f[N][N], g[N][N], h[N];
int n, T, rt;
inline int quick_pow(int x, int k)
{
int res = 1;
while (k)
{
if (k & 1)
res = 1ll * res * x % mod;
x = 1ll * x * x % mod;
k >>= 1;
}
return res;
}
inline void add(int &x, int y)
{
x += y;
x >= mod ? x -= mod : 0;
}
inline void dec(int &x, int y)
{
x -= y;
x < 0 ? x += mod : 0;
}
inline int solve(int l, int r, int lst)
{
if (l > r)
return 0;
int mid = l, now = ++T;
for (int i = l + 1; i <= r; ++i)
if (h[i] < h[mid])
mid = i;
int lc = solve(l, mid - 1, h[mid]),
rc = solve(mid + 1, r, h[mid]);
for (int i = 0; i <= len[lc]; ++i)
for (int j = 0; j <= len[rc]; ++j)
{
int t = i + j;
int a = 1ll * f[lc][i] * f[rc][j] % mod,
b = (1ll * g[lc][i] * (f[rc][j] + g[rc][j]) + 1ll * f[lc][i] * g[rc][j]) % mod;
add(f[now][t], a);
add(g[now][t], b);
dec(f[now][t + 1], a);
add(g[now][t + 1], a);
}
len[now] = len[lc] + len[rc] + 1;
for (int j = 0; j <= len[now]; ++j)
{
f[now][j] = 1ll * f[now][j] * quick_pow(ex[len[now] - j], h[mid] - lst) % mod;
g[now][j] = 1ll * g[now][j] * quick_pow(ex[len[now] - j] - 1, h[mid] - lst) % mod;
}
return now;
}
int main()
{
f[0][0] = 1;
scanf("%d", &n);
for (int i = 1; i <= n; ++i)
scanf("%d", &h[i]);
ex[0] = 1;
for (int i = 1; i <= n; ++i)
add(ex[i] = ex[i - 1], ex[i - 1]);
rt = solve(1, n, 0);
int ans = 0;
for (int i = 0; i <= n; ++i)
{
add(ans, f[rt][i]);
add(ans, g[rt][i]);
}
printf("%d\n", ans);
return 0;
}