【算法学习笔记十四】近似算法

有许多困难的组合优化问题,使用回溯或随机化不能有效地解决。

组合优化问题:在有限的可能性中找出最优解。一个近似算法将给出一个合理的解,逼近一个最优解。(大多数)近似算法的标记特征是它们是快速的(多项式时间算法)。然而,人们不应该乐观地寻找一个有效的近似算法,因为有一些困难的问题,即使存在一个合理的近似算法是不可能的,除非NP=P。

组合优化问题

输入:COP的实例I。

可行集:FEAS(1) =实例I的所有可行(或有效)解的集合,通常用一组约束表示。

目标成本函数:实例I包括对目标成本函数的描述。Cost[l]映射每个解决方案S(可行或不可行)一个实数或±\infty

目标:优化(即最小化或最大化)目标成本函数。

优化设置:OPT(I) ={Sol ∈ FEAS(I) | Cost[I] (Sol) ≤ Cost[i] (Sol'), VSol' ∈FEAS(1)},成本最小值的集合≤实例I可行的解决方案;

组合:指问题结构意味着只有有限数量的解决方案需要被检查以找到最优。

输出:一个解决方案Sol ∈ OPT(I),或报告FEAS(I) = \varnothing

COP举例:

“Easy”(多项式时间可解):最短(简单)路径,最小生成树,图匹配;

“NP-Hard”(没有已知的多项式时间解决方案):最长(简单)路径,旅行推销员,顶点覆盖,集合覆盖,K-Cluster,0/1 揹包。

 

 分类

差界算法:|C(S_A)-C(S_{OPT})|\leq K

我们从近似算法中所能期望的最大结果是,最优解的值与通过近似算法得到的解的值之间的差总是不变的。对于所有问题的实例,可以得到一个近似算法A这样|C(S_A)-C(S_{OPT})|\leq K, K是常数。但是有差分界近似算法的NP-hard优化问题很少。

平面着色问题可以用近似算法求解;

揹包问题不存在差界近似算法,除非NP=P;

装箱问题:给定一个集合,u_1,...,u_n的大小是s_1,...,s_n,其中每个s在0和1之间,我们需要将这些物品打包到单位容量的最小箱数。四种启发式方法:FF(最先适配,放第j个物品时,放入第一个可以放的箱子,且\rho _{FF}<2), BF(最优适配,放第j个物品时,使放入后箱子空余尽量少), FFD(先做从大到小的排序,在进行FF), BFD。

定理:对于装箱问题的所有实例I,FF(I)\leq \frac{17}{10}OPT(I)+2

定理:对于装箱问题的所有实例I,FFD(I)\leq \frac{11}{9}OPT(I)+4

加权顶点覆盖问题

输入:顶点权值为w(V)的无向图G(V,E),w(v)>0是顶点v\inV的权值

输出:  顶点覆盖C:  C\subseteqV覆盖所有的边

目标:最小化顶点覆盖C的权重

顶点覆盖问题表示为整数线性规划:\forall v\in V:x(v)=\left\{\begin{matrix} 1 & if\ v\in C\\ 0 & if\ v\notin C \end{matrix}\right.minimize\ \sum_{v\in V}w(v)x(v),约束条件为(P1)1)x(u)+x(v)\geq 1\ \forall (u,v)\in E \ 2)x(v)\in {0,1}\ \forall v\in V

求解:松弛——将整数线性规划变为线性规划问题,即(P2) 2)x(v)\geq 0\in {0,1}\ \forall v\in V

           对偶——(P3)maximaze\ \sum_{(u,v)\in E}p(u,v),\sum_{u:(v,u)\in E}\leq w(v) \ \forall v\in V ,p(u,v)\geq 0 \ \forall (u,v)\in E

 当\sum_{u:(v,u)\in E}= w(v)时,点v为tight;当u或者v是tight时,边(u,v)是final。

ALGORITHM Approximate-Vertex-Cover (G(V,E), w(V))
    for each edge (u,v)∈E  do   p(u,v) ← 0
    for each edge (u,v)∈E  do   finalize (u,v), i.e.,increase p(u,v) until u or v becomes tight,(取u,v中最小的,未取的减去最小的,更新price,0值放入到C中)
    C  ←  { v ∈ V |  v is tight }
    return C
end

 这是一个2-近似算法,有以下的特点:1)正确性,得到的C是可行解;2)多项式时间算法;3)W(C)\leq 2W(C_{OPT})(\rho =2\ is \ tight)

 

加权集合覆盖问题X=\{x_1,x_2,...,x_n\},F包含m个X的子集F=\{S_1,S_2,...S_m\},w(S)>0,挑选C,C\subseteq F使得C可以覆盖X,并使得权值尽可能地小:W(C)=\sum_{S\in C}w(s)

ALGORITHM   Greedy-Set-Cover (X, F, w(F))
1.     U ← X	(* uncovered elements *)
2.     C ← Ø	(* set cover *)
 while  U ≠ Ø  do 
      select S∈F that minimizes  price p = w(S) / |S∩U|
      U  ←  U - S
      C  ←  C ∪ {S} 
  return C
end

 

这是一个H(n)-近似算法(与n有关的)。

Harmonic Number:H(d)=\sum_{i=1}^{d}\frac{1}{i}\leq lnd+1

Maximumdegree:d_{max}=max\{|S|:S\in F\}\leq |X|=nH(d_{max})\leq H(n)

引理:\forall S\in F,\sum_{x\in S}p(x)\leq w(S)H(|S|)

定理:Greedy-Set-Cover算法的特点:正确性:输出可行解C;多项式运行时间;近似界:W(C)\leq H(d_{max})W(C_{OPT})\leq H(n)W(C_{OPT})

旅行商问题(TSP)

设nxn的矩阵D=(d_{ij}),表示城市i到城市j的距离。输出路径T,T从起点出发,路过每个城市且仅路过一次,最后回到起点,找出一条最短的路径T。

最小生成树,哈密尔顿回路(HCP),图的匹配,欧拉图都是NP-hard问题。

哈密尔顿回路:存在圈经过每一座城市且仅经过一次。

 定理:设\rho > 1是一个常数,一般的TSP问题的\rho -近似算法是NP-hard问题。(即不存在多项式时间\rho -近似算法)

metric-TSP:是一般TSP问题的特殊情况,也是NP-hard问题,存在2-近似算法,1.5-近似算法。欧拉图:对图G进行遍历,经过每条边且仅经过一次。

metric-TSP的2-近似算法C(T)\leq 2\times C(T_{OPT}):步骤,首先构造最小生成树,双边的MST的欧拉图了,跳过重复的点。

根据三角不等式,跳过重复点的操作不会增加哈密尔顿回路的长度 ,即哈密尔顿回路的长度不会超过欧拉图的长度。

LB=C(MST)\leq C(T_{OPT})\leq C(T)=UB\leq 2\times C(MST)=2LB

2是“紧的”,是可达的

 metric-TSP的1.5-近似算法—图的匹配,匹配集M是G的一个子集,且满足任意两条边都没有公共的顶点。完美匹配,每个点都被匹配,即位于M中(偶数个点才存在完美匹配)。

 步骤:构造MST

           找出其中度数为奇数的顶点,对找出的顶点找到最小权值的完美匹配M,E=MST+M,E是一个欧拉图

             跳过重复点的欧拉图得到TSP回路T。

 C(MST)\leq C(T_{OPT}),C(M)\leq 0.5C(T_{OPT}),C(E)=C(MST)+C(M)\leq 1.5C(T_{OPT}),C(T)\leq C(E)\leq 1.5C(T_{OPT})

1.5是可达的。

 K-聚类问题(The K-Cluster Problem)

设点集X,d(x_i,x_j)x_i,x_j之间的距离,以及正整数K,把X分成K类C_1,...,C_K,并使得K类中最长的直径最小化,即\min_{j}\max_{a,b\in C_j}d(a,b)

n=17,K=4

 贪心算法;是2-近似多项式算法;

                 (1)贪婪地逐步的从X中取K个点作为集群的“中心”,并选择离之前选择的中心最远的集群中心。

                 (2)将剩余的X点分配给离中心最近的集群。

定义:x*\in X是离\{\mu _1,...,\mu _k\}最远的点。如果我们想要k+ 1个中心,x*=\mu _{k+1},令r*=r(k+1)=min(d(x*,\mu _j) ,j=1.k}。

引理:算法具有以下性质:(a)每个点距离其簇中心最多r*的距离。(b) K+1个点\{\mu _1,...,\mu _k,\mu _{K+1}=x^*\}之间的距离至少为r*。

0/1揹包问题(可切割Fractional)

最大化:\sum_{i=1}^{n}v_ix_i

约束条件:1)\sum_{i=1}^{n}w_ix_i\leq W,2)0\leq x_i\leq 1,i=1,...n

FKP的最优解可以在O(nlogn)时间内得到。

证明:

       贪心策略:按vi/wi的递减顺序考虑;

       将物品按顺序放在揹包里,直到袋子装满;

       只有放在揹包中的最后一件物品可能被分割;

       第一步的排序时间是O(nlogn)。

01KP approximation Greedy Algorithm
Input: 2n+1 positive integers corresponding to item weights {w1...wn}, item values {v1...vn} and the knapsack capacity W
Output: A subset Z of the items whose total size is at most W
    1. Renumber the items so that v1/w1...vn/wn
    2. j←0, K←0, V←0, Z←{}
    3. while j<n and K<W
    4.     j←j+1
    5.     if wj←W-K then
    6.         Z←Z←{uj}
    7.         K←K+wj
    8.         V←V+vj
    9.     end if
  10. end while
近似度R是无界的
举例:U={u1,u2},w1=1,v1=2;w2=v2=W>2
近似解是u1,最优解是u2,R=W/2,W可以任意取

  11. Let Z’={us}, where us is an item of maximizing value
  12. if Vvs then return Z
  13. else return Z’
加上后面的代码,此时近似度R=2

\varepsilon =1/k,对于某个正整数k,算法A_\varepsilon,由两步组成。首先,选择最多有k个元素的子集,并在揹包中取出它们。然后对剩余的项运行knapsack贪婪算法。这两个步骤重复\sum_{j=0}^{k}\binom{n}{j},j是每个子集的大小,0≤j≤k。

定理15.4(PTAS):令\varepsilon =1/k对于k≥1,算法A_\varepsilon的运行时间为O(kn^{k+1}),性能比为1+\varepsilon

 

 

\rho -近似算法:多项式运行时间;1/\rho \leq C(S_A) /C(S_{OPT})\leq \rho

PTAS(多项式时间近似策略):额外输入参数e,作为相对误差的界;找到的相对误差最多为e;对于固定的e而言,关于输入规模的多项式运行时间

FPTAS:是一个PTAS,并关于输入规模和1/e的多项式时间。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章