機器人足球人工智能算法分析

前段時間做了個人機對戰的五子棋遊戲,覺得人工智能非常有意思。所以最近沒事,又思考了一下機器人足球的人工智能算法。

機器人足球和五子棋遊戲的主要聯繫是:都需要隨時分析整個棋盤/球場的狀態,並作出最合適的反應;主要區別是:五子棋遊戲是回合制的,而機器人足球是“即時”遊戲,另外五子棋只要基於某一步棋子考慮,但機器人足球必須考慮23個人/球(棋子)。

表面看區別蠻大的,現在具體來分析一下:

1)關於機器人足球的“即時”特點
22個人,再加上一個足球,場上一共有23個物體在同時運動。我們不可能說機器人足球和五子棋一樣,先一個人動,其他人站着,第一個動完再第二個人動....這樣不是在踢球,而是在表演節目。如果當年《星際爭霸》這樣的即時戰略遊戲,當人全部部署好之後,按一個ready鍵通知計算機,然後計算機慢慢悠悠測挨個處理它控制的坦克,那還有什麼樂趣。

有人肯能會說可以用多線程(我事先申明,我對多線程的瞭解,僅限於幾個簡單的例程,所以一下的敘述可能有不對的地方)。沒錯,多線程確實可以同步處理,並且對於足球這樣的遊戲,場上人員是確定的(不考慮被紅牌罰下的),用23個線程來控制人和球,似乎也沒什麼不妥()。但是如果是《星際》,造一個坦克就要新建一個進程,打死一個大兵就要銷燬一個進程....好像這樣開銷比較大。更何況計算機如果造出100架坦克,外加100個大兵,消耗的資源將相當可觀。雖然我不知道《星際》是如何實現即時戰略的,但我想即使是用多線程,也肯定有專門的算法對其進行優化。

用得着這麼複雜麼?我們再仔細分析一下即時制跟回合制之間的關係,會發現兩者其實沒有本質的區別,更準確的說,回合制其實是即時制的一個特例而已!我做五子棋的時候,爲了讓人和計算機同步,設置了一些標誌。當人下過棋後,將標誌復位,計算機纔可以下棋。它下過一次後將標誌置位,就不能繼續下了,等待人下棋。如果我們把這些標誌取消,那麼計算機就會根據當前棋盤情況自顧自的下棋,你趕得上它的節奏你可能會贏,趕不上的話,就等着輸吧!這樣五子棋也就成了一個即時戰略的遊戲了。

所以我認爲,對於機器人足球,只需要輪循計算機控制的所有球員,讓每個球員針對場上情況作出最正確的響應就行了。計算機的速度非常快,雖然是輪循,但幾乎不會察覺出其中的先後次序,給人的感覺就是在同時進行。其實操作系統的多線程,也是這樣實現的。X86構架的cpu,多線程多任務程序是運行在保護模式下的,其根本思想就是將cpu時間切片,這個時間片上處理a任務,不管有沒有處理完,下一個時間片上一定處理b任務,一圈循環下來,再繼續執行未完成的a任務。

但是還有一個問題。由於計算機的反應遠比人快,如果設計FIFA這樣的人機交互遊戲,很可能計算機將它控制的所有物體都計算好多遍了,可人還沒作出反應呢。對於強調反應能力的即時制遊戲,這種思維速度的差距可能無法接受。我的看法是,可以讓計算機處理完一遍所有物體後,暫時停頓一段時間,比如500ms,比如1s(具體長度需要測試後才能得出)。而且,計算機停頓時間的長短,也可以用來區分難度,難度越低,計算機停頓的時間也越長。當然,我這裏所說的停頓,並不是指計算機真的停止處理任何事務。計算機仍需要按照事先設定的運動方向和速度計算每個球員的新座標並不斷刷新,以顯示出動畫效果。只是每隔1s鍾,纔會作出特殊反應(踢球、搶斷等),改變運動方向和速度

 

2)機器人足球計算機考慮的點比五子棋多
場上有23個物體需要計算機處理,情況似乎比五子棋複雜的多了。但真的需要無差別的處理23個物體嗎?

我們來看看真實的足球。我不是很喜歡足球,對足球規則和各種戰術也不瞭解。我只談談我的感覺。
對於球來說,雖然它隨時都在運動,但抽象看來,它在場上的情況非常簡單:向某個方向運動,運動速度如何,目前所在的座標,就這麼三個要素。其他的什麼由哪方控制,誰踢了一腳,都不需要也不應該考慮(這符合oop思想)。

再來看看22個運動員。其實我們可以發現,往往只有離球最近的球員,纔會作出相應的反應(包括盤帶/踢球、傳球、接球、搶斷、射門等,都只有靠近球的隊員纔會作出,甚至防守的時候,也往往是防守有球的球員,歸根到底還是離球非常近)。沒見過球在前場,隊員卻在後場拼搶的(當然不考慮小動作:))。所以離球較遠的球員,只需向球跑動甚至暫時停止不前(這個可以用隨即函數來控制。影響隨機值的是球員的積極性和離球的遠近。積極的球員更加主動的奔跑,離球稍近的奔跑更主動)。只有離球近的球員,纔會作出特殊的處理。這樣細細劃分後,整體算法思路就比較清晰了。

 

 

通過上面的分析,現在來總結一下:
設計機器人足球的時候,可以使用輪循的方法,挨個處理22個隊員和1個球。一般情況下,處理方法也就是:通過原來的座標和事先確定的方向、速度,計算新的座標。當計算完所有物體的新座標後,刷新屏幕,以顯示出動畫效果。

每隔一段時間(或者若干次後),允許計算機對每個物件作出特殊操作(踢球、傳球等),這些特殊操作的本質就是改變23個物體的速度和方向,使接下來一段時間物體的運動軌跡產生變化。

做特殊操作時,可以按照球員序號遍歷。針對每個球員需要做的事情是:
1.計算這個球員離球有多遠。超過一定距離,就隨意處理(比如上面提到的,用隨即函數確定這個人是向球跑還是停止)
2.離球近的話,再查詢球周圍有沒有離球更近的球員(考慮到時間複雜度,不推薦真的去遍歷整個球場,而是維護一張表,用來記錄每個球員當前和球的距離)
3.如果有對方球員離球更近,則可選的操作有:更加靠近、搶斷、等等(我不太懂足球,不知道還有什麼操作)。可以用隨機數來確定執行的操作
4.如果有己方球員離球更近,則可以斷定此人正在帶球,此時可選的操作是:向他移動準備接應、向對方球門移動準備接傳球進攻
5.如果當前沒有其他球員離球更近,那此時可以斷定該球員正在帶球。此時需要考察周圍安全距離內有沒有對方球員,有沒有己方球員,離球門多遠等等問題,並作出傳球、射門、盤帶等等操作(沒必要真的計算其他人跟自己的距離。由於此時離球近,可以忽略不計。完全可以用其他人離球的距離來代表。具體原理,踢場球就知道了:))。這些操作比較簡單,只要用一些選擇語句就可以了。有多種操作可供選擇的時候,可以用隨機數來確定。球員的各種屬性都可以影響隨機數的取值。

除此之外,還有一些例外操作:比如當出現運動員跑着跑着出線、相撞、碰到球等情況,此時即使還沒有到例行的處理特殊操作的時候,但也必須立即針對涉及的球員執行特殊操作,否則不真實、不合理的。


最後我們來談一下球員和球的數據結構
球員:
{
方向/速度/當前座標....
傳球()/踢球()/射門()/接球()/搶斷()....../跑動()
計算新座標()
}

足球:
{
方向/速度/當前座標....
計算新座標()
friend:
球員::傳球()/踢球()...... //或者做一個改變方向/速度的接口,讓球員中的函數能調用這個接口

}

除此之外,還需要一些表,維護諸如每個球員離球的距離等信息,方便各種處理。另外還有一些細節,可能是做遊戲必須的,但由於相對來說比較簡單,所以在這裏就不多分析了。


由於精力有限,我工作、學習的壓力比較大,所以上述算法並沒有實現。我寫這篇文章,是試圖分析出即時戰略遊戲的一般設計方法。當然,我只是一個編程的初學者,所有的分析又都是我的個人看法(沒有看過相關文章);並且我不是專門做遊戲的,不可能將機器人足球的人工智能分析的如同EA的開發人員那麼徹底。所以我的分析可能很粗糙,甚至有很多錯誤。如果能對大家有一點啓發,我非常欣慰。當然,我更希望大家指出我的錯誤看法,讓我能逐步提高自己的水平。 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章