算法分析與設計——近似算法

原創

2020-06-13 09:18

一、近似算法的概念

1、爲啥要研究近似算法？

$\quad$ 目前大規模的NPC問題我們無法通過計算得到，因此我們需要通過損失一部分精度的做法來找到多項式的近似算法。

2、近似算法精度的評價

$\quad$ 用近似算法得到的解與原問題的最優解比值不超過 $ρ$ ，則稱該算法是 $ρ-近似算法$ 。難點在於在不知道最優解的情況下證明近似解與最優解的近似程度。

二、幾個經典的近似問題

1、負載均衡問題

$\quad$ 負載均衡問題：給出 $m$ 個機器， $n$ 個任務，設任務 $j$ 處理時長爲 $t_j$ 。要求如下：

每個任務只能在一個機器上不間斷的完成
每個機器不能同時處理多個任務

$\quad$ 設 $S[i]$ 表示給機器 $i$ 處理的任務集合，則機器 $i$ 的處理時長爲 $L[i]=\sum_{j\in S[i]}t_j$ 。負載均衡問題的目標就是找到一種任務分配方案使得 $min(max(L[i]))$ ，即讓每個機器處理的任務的時長儘可能均衡。
$\quad$ 這個問題是NPC問題，因爲 $Partiton問題 \le_P 負載均衡問題$ 。

近似策略1

$\quad$ 貪心策略：每次在機器中選出當前處理時長最短的機器處理下一個任務。時間複雜度爲 $O(nlogm)$ ，對於每個任務都需要從 $m$ 個機器中選出處理時長最短的機器，這個用優先隊列維護即可。這個近似算法是2-近似的，證明如下：

引理1：設最優解爲 $L^*$ ，則 $L^*\geq max_jt_j$ ，因爲至少一個機器要處理一個任務，所有任務中花費時間最長的任務所需時間爲 $max_jt_j$ ，故得到此不等式。
引理2： $L^* \geq \frac{1}{m}\sum_jt_j$ 。當每個機器處理任務的時長相同時 $L^* = \frac{1}{m}\sum_jt_j$ ，顯然其他情況下 $L^* > \frac{1}{m}\sum_jt_j$ 。
假設最後一個任務 $j$ 給了機器 $i$ ，說明在此之前，機器 $i$ 的負載時長最小，即 $L[i]-t_j\le L[k](對任意k滿足1 \le k \le m)$ 。
因爲對任意一個機器 $k$ 都滿足 $L[i]-t_j\le L[k]$ ，因此 $m(L[i]-t_j)\le \sum_kL[k]$ ，即 $L[i]-t_j\le \frac{1}{m}\sum_kL[k]=\frac{1}{m}\sum_j t_j \le L^*(引理2)$
到這裏，該近似算法求解的結果 $L=L[i]=(L[i]-t_j)+t_j \le L^*+L^*=2L^*$ ，即 $L\le 2L^*$ ，該貪心策略是該問題的2-近似算法。

$\quad$ 該近似算法能達到最優解的2倍嗎，即上述不等式是緊的嗎？是緊的！

近似策略2

$\quad$ 策略2：將任務按照處理時長 $t_j$ 從大到小排序，之後再每次在機器中選出當前處理時長最短的機器處理下一個任務。時間複雜度爲 $O(nlogn+nlogm)$ 。這個近似算法是 $\frac{3}{2}-近似$ 的，證明如下：

引理3：假設有 $m$ 個機器，超過 $m$ 個任務，這些任務按照處理時長排好序， $t_1\ge t_2 \ge \cdots \ge t_{m+1} \ge \cdots$ ，則顯然某個機器上至少要處理兩個任務，則最優解 $L^*\ge 2t_{m+1}$ 。
從近似策略1的推導可以得到 $L=L[i]=(L[i]-t_j)+t_j$ ，假設機器 $i$ 上至少有2個任務，則利用引理3可得 $t_j\le \frac{1}{2}L^*$ ，故 $L\le \frac{3}{2}L^*$ ，該策略是該問題的 $\frac{3}{2}-近似$ 算法。

$\quad$ 該近似算法能達到最優解的 $\frac{3}{2}$ 倍嗎，即上述不等式是緊的嗎？不是緊的！

2、中心點選擇問題

$\quad$ 問題描述：給出 $n$ 個點 $s_1,\cdots,s_n$ ，從中選出 $k$ 個點 $C$ ，設每個點到最近的中心點 $C$ 的距離爲 $d_i$ ，問採取何種策略選出這 $k$ 個點使得 $r(C)=max(d_i)$ 最小。這個問題是NPH問題。
$\quad$ 貪心策略：初始時隨機選一個點作爲中心點，之後的 $k-1$ 次，每次遍歷除已選做中心點的其他點，找出與該點距離最近的某個中心點計算出距離 $d_j$ 。最後在這些點中找出 $max_j d_j$ 對應的點作爲下一個中心點。這個近似算法是2-近似的，證明如下：

設 $C^*$ 是最優解對應的中心點， $C$ 是用上述貪心算法選出的中心點，則 $r(C)\le 2r(C^*)$ 。

3、帶權頂點覆蓋問題

$\quad$ 圖的每個頂點都有權重，找一個圖的頂點集合能覆蓋所有的邊，問如何選擇頂點使得這些頂點的權重和最小。用競價法去近似求解。

對於某個頂點 $i$ ，其權重爲 $w_i$ ，與該頂點相連的邊記爲 $p$ ，給這些邊賦值權重，使得 $\sum_{e=(i,j)}p_e \le w_i$ 。
設 $S$ 爲任意一個集合覆蓋，則 $\sum_ep_e\le \sum_{i\in S}\sum_{e=(i,j)}p_e\le \sum_{i\in S}w_i=w(S)$ ，故 $\sum_ep_e\le w(S)$ 。
算法流程：對於圖中任意一條邊 $e=(i,j)$ ，令 $p_e=0$ ，當 $i,j$ 頂點的 $\sum_{e=(i,j)}p_e<w_i,\sum_{e=(i,j)}p_e<w_j$ 時，增加 $p_e$ 直到滿足 $\sum_{e=(i,j)}p_e=w_i或者\sum_{e=(i,j)}p_e=w_j$ 。這時候相等的那個頂點放入 $S$ 中。
競價法是2-近似算法，證明如下：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

算法分析與設計——近似算法

一、近似算法的概念

1、爲啥要研究近似算法？

2、近似算法精度的評價

二、幾個經典的近似問題

1、負載均衡問題

近似策略1

近似策略2

2、中心點選擇問題

3、帶權頂點覆蓋問題

關於遊戲付費的一點想法

我通過CKA和CKS啦！

猿輔導技術崗算法題總結

快速計算數組中前n個數的均值和方差

python3實現無限次翻譯

Leetcode 20. 有效的括號 0ms通過

Leetcode 43 字符串相乘

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結