*禁忌搜索

 

禁忌搜索(Tabu Search或Taboo Search,簡稱TS)的思想最早由Glover(1986)提出,它是對局部領域搜索的一種擴展,是一種全局逐步尋優算法,是對人類智力過程的一種模擬。TS算法通過引入一個靈活的存儲結構和相應的禁忌準則來避免迂迴搜索,並通過藐視準則來赦免一些被禁忌的優良狀態,進而保證多樣化的有效探索以最終實現全局優化。相對於模擬退火和遺傳算法,TS是又一種搜索特點不同的 meta-heuristic算法。迄今爲止,TS算法在組合優化、生產調度、機器學習、電路設計和神經網絡等領域取得了很大的成功,近年來又在函數全局優化方面得到較多的研究,並大有發展的趨勢。本章將主要介紹禁忌搜索的優化流程、原理、算法收斂理論與實現技術等內容。

1. 引言

局部領域搜索是基於貪婪思想持續地在當前解的領域中進行搜索,雖然算法通用易實現,且容易理解,但其搜索性能完全依賴於領域結構和初解,尤其窺陷入局部極小而無法保證全局優化性。針對局部領域搜索,爲了實現全局優化,可嘗試的途徑有:以可控性概率接受劣解來逃逸局部極小,如模擬退火算法;擴大領域搜索結構,如TSP的2opt擴展到k-opt;多點並行搜索,如進化計算;變結構領域搜索( Mladenovic et al,1997);另外,就是採用TS的禁忌策略儘量避免迂迴搜索,它是一種確定性的局部極小突跳策略。

禁忌搜索是人工智能的一種體現,是局部領域搜索的一種擴展。禁忌搜索最重要的思想是標記對應已搜索的局部最優解的一些對象,並在進一步的迭代搜索中儘量避開這些對象(而不是絕對禁止循環),從而保證對不同的有效搜索途徑的探索。禁忌搜索涉及到領域(neighborhood)、禁忌表(tabu list)、禁忌長度(tabu 1ength)、候選解(candidate)、藐視準則(candidate)等概念,我們首先用一個示例來理解禁忌搜索及其各重要概念,而後給出算法的一般流程。

2.禁忌搜索示例

組合優化是TS算法應用最多的領域。置換問題,如TSP、調度問題等,是一大批組合優化問題的典型代表,在此用它來解釋簡單的禁忌搜索算法的思想和操作。對於 n元素的置換問題,其所有排列狀態數爲n!,當n較大時搜索空間的大小將是天文數字,而禁忌搜索則希望僅通過探索少數解來得到滿意的優化解。

首先,我們對置換問題定義一種鄰域搜索結構,如互換操作(SWAP),即隨機交換兩個點的位置,則每個狀態的鄰域解有Cn2=n(n一1)/2個。稱從一個狀態轉移到其鄰域中的另一個狀態爲一次移動(move),顯然每次移動將導致適配值(反比於目標函數值)的變化。其次,我們採用一個存儲結構來區分移動的屬性,即是否爲禁忌“對象”在以下示例中:考慮7元素的置換問題,並用每一狀態的相應21個鄰域解中最優的5次移動(對應最佳的5個適配值)作爲候選解;爲一定程度上防止迂迴搜索,每個被採納的移動在禁忌表中將滯留3步(即禁忌長度),即將移動在以下連續3步搜索中將被視爲禁忌對象;需要指出的是,由於當前的禁忌對象對應狀態的適配值可能很好,因此在算法中設置判斷,若禁忌對象對應的適配值優於“ best so far”狀態,則無視其禁忌屬性而仍採納其爲當前選擇,也就是通常所說的藐視準則(或稱特赦準則)。

可見,簡單的禁忌搜索是在領域搜索的基礎上,通過設置禁忌表來禁忌一些已經歷的操作,並利用藐視準則來獎勵一些優良狀態,其中領域結構、候選解、禁忌長度、禁忌對象、藐視準則、終止準則等是影響禁忌搜索算法性能的關鍵。需要指出的是:

(1)首先,由於TS是局部領域搜索的一種擴充,因此領域結構的設計很關鍵,它決定了當前解的領域解的產生形式和數目,以及各個解之間的關係。

(2)其次,出於改善算法的優化時間性能的考慮,若領域結構決定了大量的領域解(尤其對大規模問題,如TSP的SWAP操作將產生Cn2個領域解),則可以僅嘗試部分互換的結果,而候選解也僅取其中的少量最佳狀態。

(3)禁忌長度是一個很重要的關鍵參數,它決定禁忌對象的任期,其大小直接進而影響整個算法的搜索進程和行爲。同時,以上示例中,禁忌表中禁忌對象的替換是採用FIFO方式(不考慮藐視準則的作用),當然也可以採用其他方式,甚至是動態自適應的方式。

(4)藐視準則的設置是算法避免遺失優良狀態,激勵對優良狀態的局部搜索,進而實現全局優化的關鍵步驟。

(5)對於非禁忌候選狀態,算法無視它與當前狀態的適配值的優劣關係,僅考慮它們中間的最佳狀態爲下一步決策,如此可實現對局部極小的突跳(是一種確定性策略)。

(6)爲了使算法具有優良的優化性能或時間性能,必須設置一個合理的終止準則來結束整個搜索過程。

此外,在許多場合禁忌對象的被禁次數(frequency)也被用於指導搜索,以取得更大的搜索空間。禁忌次數越高,通常可認爲出現循環搜索的概率越大。

3.禁忌搜索算法流程

通過上述示例的介紹,基本上了解了禁忌搜索的機制和步驟。簡單TS算法的基本思想是:給定一個當前解(初始解)和一種鄰域,然後在當前解的鄰域中確定若干候選解;若最佳候選解對應的目標值優於“best so far”狀態,則忽視其禁忌特性,用其替代當前解和“best so far”狀態,並將相應的對象加入禁忌表,同時修改禁忌表中各對象的任期;若不存在上述候選解,則選擇在候選解中選擇非禁忌的最佳狀態爲新的當前解,而無視它與當前解的優劣,同時將相應的對象加入禁忌表,並修改禁忌表中各對象的任期;如此重複上述迭代搜索過程,直至滿足停止準則。

條理化些,則簡單禁忌搜索的算法步驟可描述如下:

(1)給定算法參數,隨機產生初始解x,置禁忌表爲空。

(2)判斷算法終止條件是否滿足?若是,則結束算法並輸出優化結果;否則,繼續以下步驟。

(3)利用當前解工的鄰域函數產生其所有(或若干)鄰域解,並從中確定若干候選解。

(4)對候選解判斷藐視準則是否滿足?若成立,則用滿足藐視準則的最佳狀態y替代x成爲新的當前解,即x=y,並用與y對應的禁忌對象替換最早進入禁忌表的禁忌對象,同時用y替換“best so far”狀態,然後轉步驟6;否則,繼續以下步驟。

(5)判斷候選解對應的各對象的禁忌屬性,選擇候選解集中非禁忌對象對應的最佳狀態爲新的當前解,同時用與之對應的禁忌對象替換最早進入禁忌表的禁忌對象元素。

(6)轉步驟(2)。

同時,上述算法可用如下流程框圖更直觀地描述,如圖4.1.1。

 

我們可以明顯地看到,鄰域函數、禁忌對象、禁忌表和藐視準則,構成了禁忌搜索算法的關鍵。其中,鄰域函數沿用局部鄰域搜索的思想,用於實現鄰域搜索;禁忌表和禁忌對象的設置,體現了算法避免迂迴搜索的特點;藐視準則,則是對優良狀態的獎勵,它是對禁忌策略的一種放鬆。需要指出的是,上述算法僅是一種簡單的禁忌搜索框架,對各關鍵環節複雜和多樣化的設計則可構造出各種禁忌搜索算法。同時,算法流程中的禁忌對象,可以是搜索狀態,也可以是特定搜索操作,甚至是搜索目標值等。

同時,與傳統的優化算法相比,TS算法的主要特點是:

(1)在搜索過程中可以接受劣解,因此具有較強的“爬山”能力;

(2)新解不是在當前解的鄰域中隨機產生,而或是優於“best so far”的解,或是非禁忌的最佳解,因此選取優良解的概率遠遠大於其他解。由於TS算法具有靈活的記憶功能和藐視準則,並且在搜索過程中可以接受劣解,所以具有較強的“爬山”能力,搜索時能夠跳出局部最優解,轉向解空間的其他區域,從而增強獲得更好的全局最優解的概率,所以TS算法是一種局部搜索能力很強的全局迭代尋優算法。


 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章