Kolmogorov複雜性簡介(轉)

轉自http://blog.163.com/bit_runner/blog/static/532422182010112011555242/

旋轉的骰子

  誰掌握了隨機概率,誰就會贏得諾貝爾獎,或者可以在賭場中消磨時間。對於正在解決隨機概率問題的數學家而言,賭博的回報非常高。

  如果有一天你在賭場消磨時光,你會注意到一種很奇怪的現象,如果連續擲一百次骰子,賭博機更多地給出奇數。於是你的腦海裏會閃現出獲取鉅額回報的念頭:是否應該賭奇數呢,或許這只是迷信在作怪?
你的困惑是一直困擾着賭徒和數學家的難題:如何分辨一個獨立的事件是隨機的還是有規律可言的。我們身邊充滿了隨機事件,從股票的價格到原子的運動,然而它們無從捉摸,如果能搞明白的話,我們也就不稱其爲隨機事件了。
形象地說,科學家永遠生活在隨機事件的汪洋大海中少數幾個有序事件的海島上,這是因爲他們只能夠研究可以描述的事物。一個真正的隨機事件本身無規律可言,因此是不可描述的。
按照經典的隨機理論當然是這樣,但是一個稱爲Kolmogorov複雜性的新觀點開始徹底推翻了傳統概念。數學家使用這個新理論發現了一件奇妙的事:在數學世界的某一個地方,角色發生了轉換,在那裏隨機事件被有序事件包圍着,就像湖被陸地包圍着一樣。
這一發現對數學家而言是一個巨大的突破。計算機科學家甚至將這一發現與導致產生量子物理學的突破相提並論,它意味着即使隨機的“湖”不是有限的,也有 可能勾畫出湖水的邊緣。有了這樣一張圖,數學家將能夠更好地研究隨機事件的本質,解決迄今未能解決的難題。計算機科學家、金融分析家甚至賭徒都能從中受 益。
使這一切成爲可能的數學概念可以追溯到六十年代中期前蘇聯數學家AndreiKolmogorov和美國數學家RoySolomonoff及 GregoryChaitin對隨機事件定義的研究。他們認爲大部分數值或位數續列都無規律可言,屬於隨機事件。但最大的問題是如何發現它們,如何區分這 些本質上缺乏明顯特徵的數值。
Kolmogorov、Chaitin和Solomonoff定義了一個數值的複雜性的概念。概括來說,一個位數序列的複雜性是指可以打印出這個序列 然後停止運行的最短的計算機程序的長度。使用“PRINT”命令,後面跟上位數續列的數字,可以寫出任何位數序列的計算機打印程序。一個序列的 Kolmogorov複雜性永遠不會超過數字序列本身與用於編碼計算機命令“PRINT”的代碼位數的長度之和。
當然,有些非隨機序列可以用更短的程序打印。圓周率的前10億位不是隨機的,因爲其可由一個很短的程序產生。而由100個1組成的序列由於有規律可 言,可用簡短的程序如“PRINT1100Times”完成。事實上,任何可用簡短的程序打印的數值不可能是隨機的,隨機數值是不可壓縮的。
雖然這一概念看似簡單而且令人矚目,但是決定Kolmogorov複雜性卻極其困難。假如一個數值有很長的位數,產生它的程序也差不多一樣長,是否就 能證明這個數值是隨機的呢?當然不能,因爲也許還存在一個你不知道的更簡短的程序可以達到同樣的目的,即這個數值可以用某種隱含的方法進行壓縮。事實上你 可能永遠不會知道是否有一個最短的程序,不僅實際上不可能發現計算這個數值的最短程序,而且在理論上也行不通。
這一難題使數學家束手無策,因爲他們只能研究很小一部分有規律的數字,剩下的隨機數字由於不可能證明其是否真正是隨機的,所以永遠不能進行研究。
因此,Kolmogorov複雜性更像是一個新奇的理論而不是一個實用的數學工具。但在最近幾年中,荷蘭阿姆斯特丹大學數學與計算機科學中心的信息理 論專家PaulVitanyi及其長期的合作伙伴、加拿大滑鐵盧大學的MingLi在應用Kolmogorov複雜性方面取得了巨大的進展。
他們驚人的研究成果與二十世紀初德國數學家HansHeilbronn提出的著名的幾何學問題有關。這一問題討論的是如果在一個正方形中放置n個石子 並在其間連接出一系列的三角形,石子如何分佈才能使產生的最小三角形的面積最大。數學家將最小三角形的最大可能面積稱爲第n個Heilbronn數。
即使石子的數量很小,解決這個問題也極具挑戰性。有五個石子時,Heilbronn數約爲0.1924,即最小三角形面積是正方形面積的0.1924 倍。第六個Heilbronn數是正方形面積的1/8。但是在有7個石子時,Heilbronn數就很難計算了。Heilbronn懷疑在石子數量很大 時,Heilbronn數約爲1/n2,即1000個石子時,最小的三角形的面積不會大於正方形面積的一百萬分之一。但是1982年,幾何學家證明Heilbronn的猜測是錯誤的,n的實際指數可能在8/7和2之間。但到目前爲止,還沒有人知道如何計算出正確的數值。
這個難題的另一個版本更加難以解決,即Vitanyi及其同事選擇攻克的難題。他們不是尋找n個石子的最佳分佈,而是設想如果石子隨機地落到正方形 中,將會出現什麼樣的情況,在這種情況下形成的最小三角形的面積大小又如何。這裏要涉及隨機事件的問題。在研究石子的某一種分佈時如何能夠確定其是隨機的 呢?
Li、Vitanyi和加拿大安大略省漢密爾頓McMaster大學的TaoJiang推測,儘管答案本身必須涉及隨機概念,但是對答案的任何細微的 偏離都會包括一些有序事件,並可以使用Kolmogorov複雜性理論將其識別和排除。這樣,他們可以通過消除所有的非隨機概率,只留下隨機事件,從而逼 近答案。
這一方法的核心是使用正方形內的座標爲石子定位,也就是說任何石子的分佈都可由一個數字序列表示。如果可以寫出一段較短的能產生同樣序列的計算機程序,對序列進行壓縮,則石子的分佈不可能是隨機的。
就像很多數學證明一樣,第一步是猜測答案,然後證明它的正確性。Vitanyi及其同事猜測了一個答案,並證明如果石子的間距大於猜測距離,則在往正 方形上添加石子時,石子的分佈將是有規律可循的。同樣,他們也證明了如果石子的間距小於這個猜測距離,至少會有三個石子位於同一直線上,這樣就可以對座標 序列進行壓縮,它不是隨機的。通過證明石子間距不能大於或小於猜測距離,即描繪出了隨機事件的界限,剩下的唯一可能就是該猜想是正確的。
研究小組使用這種方法證明了最小三角形的面積與正方形面積的比爲1/n3。因此,如果一個正方形中分佈有1000個石子,則最小三角形的面積約爲正方形面積的十億分之一。1999年2月他們在因特網上發表了這個研究成果。
這是一項極爲出色的成就。數學家現在有了一個強有力的方法可以準確地陳述隨機事件而不僅僅是給出一個隨機數。Vitanyi說:“隨機事件是可互換的,這是因爲它們沒有可用來有效地選擇子集的特性。它們就像海洋中的水分子一樣不可區分。”
對每一個有可能發生的隨機事件的分佈而言,上述答案都是正確的。最巨大的進步是數學家已經由完全忽略每一個隨機序列飛躍到能夠對所有的隨機事件進行一 些描述。由於絕大部分的數值是隨機的,因此,這是一個令人矚目的成就。所以,美國斯坦福大學計算機複雜性方面的首任專家、Sun公司的創始人之一 VaughanPratt稱Kolomogorov複雜性理論是一項可以與物理學的波粒二象性的發現相比擬的偉大理論。當物理學家不再認爲亞原子粒子是位 於空間中的某一點,而是一個分佈在空間中的波後,他們就能夠更好地預測粒子的特性。同樣,通過將隨機數當作不能確定的對象處理,數學家們有了一個嶄新、強 大的解決問題的方法。VaughanPratt說:“這使你可以集中精力於所有可能性的計算。”
這一發現的意義超出了純數學的範疇。Vitanyi的研究小組及其它數學家正在尋找將這一新發現應用於計算機科學的方法。其中的一個重要應用是確定某 一計算機程序的平均運行時間。通常這一問題的解決都被簡化爲找到一個用於測試程序的平均數,而平均數不具有代表程序運行特別快或特別慢的數值序列或分佈, 雖然從數學上說平均數應該與一個隨機數基本相等。計算機科學家深刻地認識到找到一個真正隨機的數值是極爲困難的,他們只能去尋找最佳和最差的情況,也就是 去尋找一組特殊的數值序列來表示程序運行的最長和最短時間。在平均條件下最糟的情況可能與程序運行的速度無關,因此這一方法並不成功。
但現在也許有了新的解決方法。最近Vitanyi和同事將測定隨機事件的概念應用於確定一個被稱爲Shell的目錄分類程序的平均運行時間,這是四十 年來一直未解決的一個問題。現在測定隨機事件的概念正在普及,美國新澤西州的數學家和計算機科學家XiaoWang稱這一方法爲更好地解決華爾街最複雜的 問題之一,即如何確定衍生金融工具的公平市價問題,指明瞭方向。這些衍生金融工具的價值取決於股票根據規定的總量跌漲的可能性,因而也取決於對市場隨機波 動的預測。
由於股票市場極其複雜,像Wang這樣的分析家不會使用一個數學公式爲衍生金融工具定價(雖然經濟學家FisherBlack和 MyronScholes最近因發明了這樣一個公式而贏得諾貝爾獎,但許多分析家認爲他們對投資者如何做出反應的預測太簡單化了),而是在強大的計算機上 對股市進行多次模擬後,作出平均預測,這一方法稱爲蒙特卡羅法。Wang說:“這對很多問題都有效而且非常簡單。不足之處是其達到可靠預測所需的時間極 長。”
Wang認爲,要談蒙特卡羅法的低效率還需回到Heilbronn問題,當計算機模擬諸如正方形中點的隨機分佈等問題時,會產生過多的點“簇”, Wang說:“如果在某一給定的區域中有一個點簇,就會過份強調那個區域。”Wang成立了一家名爲高級分析(AdvancedAnalytics)的財 務諮詢公司,推銷一種專利方法,這種方法能夠給出雖然不是隨機的、但分佈更平均的序列。因此Vitancy、Li和Jiang的成果成了Wang的專利方 法的數學保證。他們的成果通過精確描述隨機模擬中簇聚的程度,使Wang可以確定在使用更多的相同模擬後可以達到什麼結果。
愛玩計算機動畫擲骰子游戲的賭徒現在也有了希望,在本文開頭的例子中,賭奇數是一個好主意,一行中出現100個奇數不是僥倖,而是一個很容易壓縮的有規律的結果,因此不可能是隨機過程的結果。趁管理人員還未發現,趕緊用這種方法賭博吧。

(周奇編譯自《NewScientist》99-11月號)

發佈了18 篇原創文章 · 獲贊 26 · 訪問量 12萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章