我見過的最容易讀懂的 a*算法(A*尋路初探)

http://blog.vckbase.com/panic/archive/2005/03/20/3778.html

A*尋路初探

原文:Patrick Lester
翻譯:Panic
2005年3月18日

原文出處:A* Pathfinding for Beginners


譯者序
  
很久以前就知道了A*算法,但是從未認真讀過相關的文章,也沒有看過代碼,只是腦子裏有個模糊的概念。這次決定從頭開始,研究一下這個被人推崇備至的簡單方法,作爲學習人工智能的開始。
這篇文章非常知名,國內應該有不少人翻譯過它,我沒有查找,覺得翻譯本身也是對自身英文水平的鍛鍊。經過努力,終於完成了文檔,也明白的A*算法的原理。毫無疑問,作者用形象的描述,簡潔詼諧的語言由淺入深的講述了這一神奇的算法,相信每個讀過的人都會對此有所認識(如果沒有,那就是偶的翻譯太差了--b)。
  以下是翻譯的正文。(由於本人使用ultraedit編輯,所以沒有對原文中的各種鏈接加以處理(除了圖表),也是爲了避免未經許可鏈接的嫌疑,有興趣的讀者可以參考原文。


會者不難,A*(唸作A星)算法對初學者來說的確有些難度。

  這篇文章並不試圖對這個話題作權威的陳述。取而代之的是,它只是描述算法的原理,使你可以在進一步的閱讀中理解其他相關的資料。
  最後,這篇文章沒有程序細節。你儘可以用任意的計算機程序語言實現它。如你所願,我在文章的末尾包含了一個指向例子程序的鏈接。 壓縮包包括C++和Blitz Basic兩個語言的版本,如果你只是想看看它的運行效果,裏面還包含了可執行文件。

我們正在提高自己。讓我們從頭開始......

序:搜索區域

  假設有人想從A點移動到一牆之隔的B點,如下圖,綠色的是起點A,紅色是終點B,藍色方塊是中間的牆。

圖1
[圖1]

  你首先注意到,搜索區域被我們劃分成了方形網格。像這樣,簡化搜索區域,是尋路的第一步。這一方法把搜索區域簡化成了一個二維數組。數組的每一個元素是網格的一個方塊,方塊被標記爲可通過的和不可通過的。路徑被描述爲從A到B我們經過的方塊的集合。一旦路徑被找到,我們的人就從一個方格的中心走向另一個,直到到達目的地。
  這些中點被稱爲“節點”。當你閱讀其他的尋路資料時,你將經常會看到人們討論節點。爲什麼不把他們描述爲方格呢?因爲有可能你的路徑被分割成其他不是方格的結構。他們完全可以是矩形,六角形,或者其他任意形狀。節點能夠被放置在形狀的任意位置-可以在中心,或者沿着邊界,或其他什麼地方。我們使用這種系統,無論如何,因爲它是最簡單的。

開始搜索

  正如我們處理上圖網格的方法,一旦搜索區域被轉化爲容易處理的節點,下一步就是去引導一次找到最短路徑的搜索。在A*尋路算法中,我們通過從點A開始,檢查相鄰方格的方式,向外擴展直到找到目標。

我們做如下操作開始搜索:

  1. 從點A開始,並且把它作爲待處理點存入一個“開啓列表”。開啓列表就像一張購物清單。儘管現在列表裏只有一個元素,但以後就會多起來。你的路徑可能會通過它包含的方格,也可能不會。基本上,這是一個待檢查方格的列表。
  2. 尋找起點周圍所有可到達或者可通過的方格,跳過有牆,水,或其他無法通過地形的方格。也把他們加入開啓列表。爲所有這些方格保存點A作爲“父方格”。當我們想描述路徑的時候,父方格的資料是十分重要的。後面會解釋它的具體用途。
  3. 從開啓列表中刪除點A,把它加入到一個“關閉列表”,列表中保存所有不需要再次檢查的方格。

  在這一點,你應該形成如圖的結構。在圖中,暗綠色方格是你起始方格的中心。它被用淺藍色描邊,以表示它被加入到關閉列表中了。所有的相鄰格現在都在開啓列表中,它們被用淺綠色描邊。每個方格都有一個灰色指針反指他們的父方格,也就是開始的方格。

圖2
[圖2]

  接着,我們選擇開啓列表中的臨近方格,大致重複前面的過程,如下。但是,哪個方格是我們要選擇的呢?是那個F值最低的。

路徑評分

選擇路徑中經過哪個方格的關鍵是下面這個等式:

F = G + H

這裏:

  • G = 從起點A,沿着產生的路徑,移動到網格上指定方格的移動耗費。
  • H = 從網格上那個方格移動到終點B的預估移動耗費。這經常被稱爲啓發式的,可能會讓你有點迷惑。這樣叫的原因是因爲它只是個猜測。我們沒辦法事先知道路徑的長度,因爲路上可能存在各種障礙(牆,水,等等)。雖然本文只提供了一種計算H的方法,但是你可以在網上找到很多其他的方法。

  我們的路徑是通過反覆遍歷開啓列表並且選擇具有最低F值的方格來生成的。文章將對這個過程做更詳細的描述。首先,我們更深入的看看如何計算這個方程。
  正如上面所說,G表示沿路徑從起點到當前點的移動耗費。在這個例子裏,我們令水平或者垂直移動的耗費爲10,對角線方向耗費爲14。我們取這些值是因爲沿對角線的距離是沿水平或垂直移動耗費的的根號2(別怕),或者約1.414倍。爲了簡化,我們用10和14近似。比例基本正確,同時我們避免了求根運算和小數。這不是隻因爲我們怕麻煩或者不喜歡數學。使用這樣的整數對計算機來說也更快捷。你不就就會發現,如果你不使用這些簡化方法,尋路會變得很慢。
  既然我們在計算沿特定路徑通往某個方格的G值,求值的方法就是取它父節點的G值,然後依照它相對父節點是對角線方向或者直角方向(非對角線),分別增加14和10。例子中這個方法的需求會變得更多,因爲我們從起點方格以外獲取了不止一個方格。
  H值可以用不同的方法估算。我們這裏使用的方法被稱爲曼哈頓方法,它計算從當前格到目的格之間水平和垂直的方格的數量總和,忽略對角線方向。然後把結果乘以10。這被成爲曼哈頓方法是因爲它看起來像計算城市中從一個地方到另外一個地方的街區數,在那裏你不能沿對角線方向穿過街區。很重要的一點,我們忽略了一切障礙物。這是對剩餘距離的一個估算,而非實際值,這也是這一方法被稱爲啓發式的原因。想知道更多?你可以在這裏找到方程和額外的註解。
  F的值是G和H的和。第一步搜索的結果可以在下面的圖表中看到。F,G和H的評分被寫在每個方格里。正如在緊挨起始格右側的方格所表示的,F被打印在左上角,G在左下角,H則在右下角。

圖3
[圖3]

  現在我們來看看這些方格。寫字母的方格里,G = 10。這是因爲它只在水平方向偏離起始格一個格距。緊鄰起始格的上方,下方和左邊的方格的G值都等於10。對角線方向的G值是14。
  H值通過求解到紅色目標格的曼哈頓距離得到,其中只在水平和垂直方向移動,並且忽略中間的牆。用這種方法,起點右側緊鄰的方格離紅色方格有3格距離,H值就是30。這塊方格上方的方格有4格距離(記住,只能在水平和垂直方向移動),H值是40。你大致應該知道如何計算其他方格的H值了~。
每個格子的F值,還是簡單的由G和H相加得到

繼續搜索

  爲了繼續搜索,我們簡單的從開啓列表中選擇F值最低的方格。然後,對選中的方格做如下處理:

 4.把它從開啓列表中刪除,然後添加到關閉列表中。
 5.檢查所有相鄰格子。跳過那些已經在關閉列表中的或者不可通過的(有牆,水的地形,或者其他    無法通過的地形),把他們添加進開啓列表,如果他們還不在裏面的話。把選中的方格作爲新的方格的父節點。
 6.如果某個相鄰格已經在開啓列表裏了,檢查現在的這條路徑是否更好。換句話說,檢查如果我們用新的路徑到達它的話,G值是否會更低一些。如果不是,那就什麼都不做。
另一方面,如果新的G值更低,那就把相鄰方格的父節點改爲目前選中的方格(在上面的圖表中,把箭頭的方向改爲指向這個方格)。最後,重新計算F和G的值。如果這看起來不夠清晰,你可以看下面的圖示。

  好了,讓我們看看它是怎麼運作的。我們最初的9格方格中,在起點被切換到關閉列表中後,還剩8格留在開啓列表中。這裏面,F值最低的那個是起始格右側緊鄰的格子,它的F值是40。因此我們選擇這一格作爲下一個要處理的方格。在緊隨的圖中,它被用藍色突出顯示。

圖4
[圖4]

  首先,我們把它從開啓列表中取出,放入關閉列表(這就是他被藍色突出顯示的原因)。然後我們檢查相鄰的格子。哦,右側的格子是牆,所以我們略過。左側的格子是起始格。它在關閉列表裏,所以我們也跳過它。
  其他4格已經在開啓列表裏了,於是我們檢查G值來判定,如果通過這一格到達那裏,路徑是否更好。我們來看選中格子下面的方格。它的G值是14。如果我們從當前格移動到那裏,G值就會等於20(到達當前格的G值是10,移動到上面的格子將使得G值增加10)。因爲G值20大於14,所以這不是更好的路徑。如果你看圖,就能理解。與其通過先水平移動一格,再垂直移動一格,還不如直接沿對角線方向移動一格來得簡單。
  當我們對已經存在於開啓列表中的4個臨近格重複這一過程的時候,我們發現沒有一條路徑可以通過使用當前格子得到改善,所以我們不做任何改變。既然我們已經檢查過了所有鄰近格,那麼就可以移動到下一格了。
  於是我們檢索開啓列表,現在裏面只有7格了,我們仍然選擇其中F值最低的。有趣的是,這次,有兩個格子的數值都是54。我們如何選擇?這並不麻煩。從速度上考慮,選擇最後添加進列表的格子會更快捷。這種導致了尋路過程中,在靠近目標的時候,優先使用新找到的格子的偏好。但這無關緊要。(對相同數值的不同對待,導致不同版本的A*算法找到等長的不同路徑。)

那我們就選擇起始格右下方的格子,如圖。

圖5
[圖5]

  這次,當我們檢查相鄰格的時候,發現右側是牆,於是略過。上面一格也被略過。我們也略過了牆下面的格子。爲什麼呢?因爲你不能在不穿越牆角的情況下直接到達那個格子。你的確需要先往下走然後到達那一格,按部就班的走過那個拐角。(註解:穿越拐角的規則是可選的。它取決於你的節點是如何放置的。)
  這樣一來,就剩下了其他5格。當前格下面的另外兩個格子目前不在開啓列表中,於是我們添加他們,並且把當前格指定爲他們的父節點。其餘3格,兩個已經在關閉列表中(起始格,和當前格上方的格子,在表格中藍色高亮顯示),於是我們略過它們。最後一格,在當前格的左側,將被檢查通過這條路徑,G值是否更低。不必擔心,我們已經準備好檢查開啓列表中的下一格了。

我們重複這個過程,知道目標格被添加進開啓列表,就如在下面的圖中所看到的。

圖6
[圖6]

  注意,起始格下方格子的父節點已經和前面不同的。之前它的G值是28,並且指向右上方的格子。現在它的G值是20,指向它上方的格子。這在尋路過程中的某處發生,當應用新路徑時,G值經過檢查變得低了-於是父節點被重新指定,G和F值被重新計算。儘管這一變化在這個例子中並不重要,在很多場合,這種變化會導致尋路結果的巨大變化。
  那麼,我們怎麼確定這條路徑呢?很簡單,從紅色的目標格開始,按箭頭的方向朝父節點移動。這最終會引導你回到起始格,這就是你的路徑!看起來應該像圖中那樣。從起始格A移動到目標格B只是簡單的從每個格子(節點)的中點沿路徑移動到下一個,直到你到達目標點。就這麼簡單。

圖7
[圖7]

A*方法總結

好,現在你已經看完了整個說明,讓我們把每一步的操作寫在一起:
 

  1. 把起始格添加到開啓列表。
  2. 重複如下的工作:
    a) 尋找開啓列表中F值最低的格子。我們稱它爲當前格。
    b) 把它切換到關閉列表。
    c) 對相鄰的8格中的每一個?
    • 如果它不可通過或者已經在關閉列表中,略過它。反之如下。
    • 如果它不在開啓列表中,把它添加進去。把當前格作爲這一格的父節點。記錄這一格的F,G,和H值。
    • 如果它已經在開啓列表中,用G值爲參考檢查新的路徑是否更好。更低的G值意味着更好的路徑。如果是這樣,就把這一格的父節點改成當前格,並且重新計算這一格的G和F值。如果你保持你的開啓列表按F值排序,改變之後你可能需要重新對開啓列表排序。
    d) 停止,當你
    • 把目標格添加進了開啓列表,這時候路徑被找到,或者
    • 沒有找到目標格,開啓列表已經空了。這時候,路徑不存在。
  3. 保存路徑。從目標格開始,沿着每一格的父節點移動直到回到起始格。這就是你的路徑。

題外話

  離題一下,見諒,值得一提的是,當你在網上或者相關論壇看到關於A*的不同的探討,你有時會看到一些被當作A*算法的代碼而實際上他們不是。要使用A*,你必須包含上面討論的所有元素--特定的開啓和關閉列表,用F,G和H作路徑評價。有很多其他的尋路算法,但他們並不是A*,A*被認爲是他們當中最好的。Bryan Stout在這篇文章後面的參考文檔中論述了一部分,包括他們的一些優點和缺點。有時候特定的場合其他算法會更好,但你必須很明確你在作什麼。好了,夠多的了。回到文章。

實現的註解

  現在你已經明白了基本原理,寫你的程序的時候還得考慮一些額外的東西。下面這些材料中的一些引用了我用C++和Blitz Basic寫的程序,但對其他語言寫的代碼同樣有效。

  1. 維護開啓列表:這是A*尋路算法最重要的組成部分。每次你訪問開啓列表,你都需要尋找F值最低的方格。有幾種不同的方法實現這一點。你可以把路徑元素隨意保存,當需要尋找F值最低的元素的時候,遍歷開啓列表。這很簡單,但是太慢了,尤其是對長路徑來說。這可以通過維護一格排好序的列表來改善,每次尋找F值最低的方格只需要選取列表的首元素。當我自己實現的時候,這種方法是我的首選。
      在小地圖。這種方法工作的很好,但它並不是最快的解決方案。更苛求速度的A*程序員使用叫做“binary heap”的方法,這也是我在代碼中使用的方法。憑我的經驗,這種方法在大多數場合會快2~3倍,並且在長路經上速度呈幾何級數提升(10倍以上速度)。如果你想了解更多關於binary heap的內容,查閱我的文章:Using Binary Heaps in A* Pathfinding
  2. 其他單位:如果你恰好看了我的例子代碼,你會發現它完全忽略了其他單位。我的尋路者事實上可以相互穿越。取決於具體的遊戲,這也許可以,也許不行。如果你打算考慮其他單位,希望他們能互相繞過,我建議在尋路算法中忽略其他單位,寫一些新的代碼作碰撞檢測。當碰撞發生,你可以生成一條新路徑或者使用一些標準的移動規則(比如總是向右,等等)直到路上沒有了障礙,然後再生成新路徑。爲什麼在最初的路徑計算中不考慮其他單位呢?那是因爲其他單位會移動,當你到達他們原來的位置的時候,他們可能已經離開了。這有可能會導致奇怪的結果,一個單位突然轉向,躲避一個已經不在那裏的單位,並且會撞到計算完路徑後,衝進它的路徑中的單位。
      然而,在尋路算法中忽略其他對象,意味着你必須編寫單獨的碰撞檢測代碼。這因遊戲而異,所以我把這個決定權留給你。參考文獻列表中,Bryan Stout的文章值得研究,裏面有一些可能的解決方案(像魯棒追蹤,等等)。
  3. 一些速度方面的提示:當你開發你自己的A*程序,或者改寫我的,你會發現尋路佔據了大量的CPU時間,尤其是在大地圖上有大量對象在尋路的時候。如果你閱讀過網上的其他材料,你會明白,即使是開發了星際爭霸或帝國時代的專家,這也無可奈何。如果你覺得尋路太過緩慢,這裏有一些建議也許有效:
    • 使用更小的地圖或者更少的尋路者。
    • 不要同時給多個對象尋路。取而代之的是把他們加入一個隊列,把尋路過程分散在幾個遊戲週期中。如果你的遊戲以40週期每秒的速度運行,沒人能察覺。但是他們會發覺遊戲速度突然變慢,當大量尋路者計算自己路徑的時候。
    • 儘量使用更大的地圖網格。這降低了尋路中搜索的總網格數。如果你有志氣,你可以設計兩個或者更多尋路系統以便使用在不同場合,取決於路徑的長度。這也正是專業人士的做法,用大的區域計算長的路徑,然後在接近目標的時候切換到使用小格子/區域的精細尋路。如果你對這個觀點感興趣,查閱我的文章 :Two-Tiered A* Pathfinding
    • 使用路徑點系統計算長路徑,或者預先計算好路徑並加入到遊戲中。
    • 預處理你的地圖,表明地圖中哪些區域是不可到達的。我把這些區域稱作“孤島”。事實上,他們可以是島嶼或其他被牆壁包圍等無法到達的任意區域。A*的下限是,當你告訴它要尋找通往那些區域的路徑時,它會搜索整個地圖,直到所有可到達的方格/節點都被通過開啓列表和關閉列表的計算。這會浪費大量的CPU時間。可以通過預先確定這些區域(比如通過flood-fill或類似的方法)來避免這種情況的發生,用某些種類的數組記錄這些信息,在開始尋路前檢查它。在我Blitz版本的代碼中,我建立了一個地圖預處理器來作這個工作。它也標明瞭尋路算法可以忽略的死端,這進一步提高了尋路速度。
  4. 不同的地形損耗:在這個教程和我附帶的程序中,地形只有兩種-可通過的和不可通過的。但是你可能會需要一些可通過的地形,但是移動耗費更高-沼澤,小山,地牢的樓梯,等等。這些都是可通過但是比平坦的開闊地移動耗費更高的地形。類似的,道路應該比自然地形移動耗費更低。
      這個問題很容易解決,只要在計算任何地形的G值的時候增加地形損耗就可以了。簡單的給它增加一些額外的損耗就可以了。由於A*算法已經按照尋找最低耗費的路徑來設計,所以很容易處理這種情況。在我提供的這個簡單的例子裏,地形只有可通過和不可通過兩種,A*會找到最短,最直接的路徑。但是在地形耗費不同的場合,耗費最低的路徑也許會包含很長的移動距離-就像沿着路繞過沼澤而不是直接穿過它。
      一種需額外考慮的情況是被專家稱之爲“influence mapping”的東西(暫譯爲影響映射圖)。就像上面描述的不同地形耗費一樣,你可以創建一格額外的分數系統,並把它應用到尋路的AI中。假設你有一張有大批尋路者的地圖,他們都要通過某個山區。每次電腦生成一條通過那個關口的路徑,它就會變得更擁擠。如果你願意,你可以創建一個影響映射圖對有大量屠殺事件的格子施以不利影響。這會讓計算機更傾向安全些的路徑,並且幫助它避免總是僅僅因爲路徑短(但可能更危險)而持續把隊伍和尋路者送到某一特定路徑。
  5. 處理未知區域:你是否玩過這樣的PC遊戲,電腦總是知道哪條路是正確的,即使它還沒有偵察過地圖?對於遊戲,尋路太好會顯得不真實。幸運的是,這是一格可以輕易解決的問題。
      答案就是爲每個不同的玩家和電腦(每個玩家,而不是每個單位--那樣的話會耗費大量的內存)創建一個獨立的“knownWalkability”數組,每個數組包含玩家已經探索過的區域,以及被當作可通過區域的其他區域,直到被證實。用這種方法,單位會在路的死端徘徊並且導致錯誤的選擇直到他們在周圍找到路。一旦地圖被探索了,尋路就像往常那樣進行。
  6. 平滑路徑:儘管A*提供了最短,最低代價的路徑,它無法自動提供看起來平滑的路徑。看一下我們的例子最終形成的路徑(在圖7)。最初的一步是起始格的右下方,如果這一步是直接往下的話,路徑不是會更平滑一些嗎?
      有幾種方法來解決這個問題。當計算路徑的時候可以對改變方向的格子施加不利影響,對G值增加額外的數值。也可以換種方法,你可以在路徑計算完之後沿着它跑一遍,找那些用相鄰格替換會讓路徑看起來更平滑的地方。想知道完整的結果,查看 Marco Pinter 發表在 Gamasutra.com 的 一篇文章:Toward More Realistic Pathfinding (免費,但是需要註冊)。
  7. 非方形搜索區域:在我們的例子裏,我們使用簡單的2D方形圖。你可以不使用這種方式。你可以使用不規則形狀的區域。想想冒險棋的遊戲,和遊戲中那些國家。你可以設計一個像那樣的尋路關卡。爲此,你可能需要建立一個國家相鄰關係的表格,和從一個國家移動到另一個的G值。你也需要估算H值的方法。其他的事情就和例子中完全一樣了。當你需要向開啓列表中添加新元素的時候,不需使用相鄰的格子,取而代之的是從表格中尋找相鄰的國家。
      類似的,你可以爲一張確定的地形圖創建路徑點系統,路徑點一般是路上,或者地牢通道的轉折點。作爲遊戲設計者,你可以預設這些路徑點。兩個路徑點被認爲是相鄰的如果他們之間的直線上沒有障礙的話。在冒險棋的例子裏,你可以保存這些相鄰信息在某個表格裏,當需要在開啓列表中添加元素的時候使用它。然後你就可以記錄關聯的G值(可能使用兩點間的直線距離),H值(可以使用到目標點的直線距離),其他都按原先的做就可以了。
另一個在非方形區域搜索RPG地圖的例子,查看我的文章:Two-Tiered A* Pathfinding

進一步的閱讀

  好,現在你對一些進一步的觀點有了初步認識。這時,我建議你研究我的源代碼。包裏面包含兩個版本,一個是用C++寫的,另一個用Blitz Basic。順便說一句,兩個版本都註釋詳盡,容易閱讀,這裏是鏈接。

例子代碼:A* Pathfinder (2D) Version 1.71

  如果你既不用C++也不用Blitz Basic,在C++版本里有兩個小的可執行文件。Blitz Basic可以在從Blitz Basic網站免費下載的 litz Basic 3D(不是Blitz Plus)演示版上運行。Ben O''Neill提供一個聯機演示可以在這裏找到。

你也該看看以下的網頁。讀了這篇教程後,他們應該變得容易理解多了。

  • Amit 的 A* 頁面:這是由Amit Patel製作,被廣泛引用的頁面,如果你沒有事先讀這篇文章,可能會有點難以理解。值得一看。尤其要看Amit關於這個問題的自己的看法。
  • Smart Moves:智能尋路:Bryan Stout發表在Gamasutra.com的這篇文章需要註冊才能閱讀。註冊是免費的而且比起這篇文章和網站的其他資源,是非常物有所值的。Bryan用Delphi寫的程序幫助我學習A*,也是我的A*代碼的靈感之源。它還描述了A*的幾種變化。
  • 地形分析:這是一格高階,但是有趣的話題,Dave Pottinge撰寫,Ensemble Studios的專家。這傢伙參與了帝國時代和君王時代的開發。別指望看懂這裏所有的東西,但是這是篇有趣的文章也許會讓你產生自己的想法。它包含一些對mip-mapping,influence mapping以及其他一些高級AI/尋路觀點。對"flood filling"的討論使我有了我自己的“死端”和“孤島”的代碼的靈感,這些包含在我Blitz版本的代碼中。

其它一些值得一看的網站:

其它參考文章:

好了,這就是全部。如果你剛好寫一個運用這些觀點的程序,我想見識見識。你可以這樣聯繫我:

現在,好運!
 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章