數學之美 十四 談談數學模型的重要性

注一直關注數學之美系列的讀者可能已經發現,我們對任何問題總是在找相應的準確的數學模型。爲了說明模型的重要性,今年七月份我在 Google 中國內部講課時用了整整一堂課來講這個問題,下面的內容是我講座的摘要。

在包括哥白尼、伽利略和牛頓在內的所有天文學家中,我最佩服的是地心說的提出者托勒密。雖然天文學起源於古埃及,並且在古巴比倫時,人們就觀測到了五大行星(金、木、水、火、土)運行的軌跡,以及行星在近日點運動比遠日點快。(下圖是在地球上看到的金星的軌跡,看過達芬奇密碼的讀者知道金星大約每四年在天上畫一個五角星。)



但是真正創立了天文學,並且計算出諸多天體運行軌跡的是兩千年前古羅馬時代的托勒密。雖然今天我們可能會嘲笑托勒密犯的簡單的錯誤,但是真正瞭解托勒密貢獻的人都會對他肅然起敬。托勒密發明了球座標,定義了包括赤道和零度經線在內的經緯線,他提出了黃道,還發明瞭弧度制。

當然,他最大也是最有爭議的發明是地心說。雖然我們知道地球是圍繞太陽運動的,但是在當時,從人們的觀測出發,很容易得到地球是宇宙中心的結論。從地球上看,行星的運動軌跡是不規則的,托勒密的偉大之處是用四十個小圓套大圓的方法,精確地計算出了所有行星運動的軌跡。(托勒密繼承了畢達格拉斯的一些思想,他也認爲圓是最完美的幾何圖形。)托勒密模型的精度之高,讓以後所有的科學家驚歎不已。即使今天,我們在計算機的幫助下,也很難解出四十個套在一起的圓的方程。每每想到這裏,我都由衷地佩服托勒密。一千五百年來,人們根據他的計算決定農時。但是,經過了一千五百年,托勒密對太陽運動的累積誤差,還是差出了一星期。


地心說的示意圖,我國天文學家張衡的渾天地動說其實就是地心說。

糾正地心說錯誤不是靠在托勒密四十個圓的模型上再多套上幾個圓,而是進一步探索真理。哥白尼發現,如果以太陽爲中心來描述星體的運行,只需要 8-10 個圓,就能計算出一個行星的運動軌跡,他提出了日心說。很遺憾的事,哥白尼正確的假設並沒有得到比托勒密更好的結果,哥白尼的模型的誤差比托勒密地要大不少。這是教會和當時人們認爲哥白尼的學說是邪說的一個原因,所以日心說要想讓人心服口服地接受,就得更準確地描述行星運動。

完成這一使命的是開普勒。開普勒在所有一流的天文學家中,資質較差,一生中犯了無數低級的錯誤。但是他有兩條別人沒有的東西,從他的老師第谷手中繼承的大量的、在當時最精確的觀測數據,以及運氣。開普勒很幸運地發現了行星圍繞太陽運轉的軌道實際是橢圓形的,這樣不需要用多個小圓套大圓,而只要用一個橢圓就能將星體運動規律描述清楚了。只是開普勒的知識和水平不足以解釋爲什麼行星的軌道是橢圓形的。最後是偉大的科學家牛頓用萬有引力解釋了這個問題。

故事到這裏似乎可以結束了。但是,許多年後,又有了個小的波瀾。天文學家們發現,天王星的實際軌跡和用橢圓模型算出來的不太符合。當然,偷懶的辦法是接着用小圓套大圓的方法修正,但是一些嚴肅的科學家在努力尋找真正的原因。英國的亞當斯和法國的維內爾(Verrier)獨立地發現了吸引天王星偏離軌道的海王星。

講座結束前,我和 Google 中國的工程師們一同總結了這麼幾個結論:
1. 一個正確的數學模型應當在形式上是簡單的。(托勒密的模型顯然太複雜。)
2. 一個正確的模型在它開始的時候可能還不如一個精雕細琢過的錯誤的模型來的準確,但是,如果我們認定大方向是對的,就應該堅持下去。(日心說開始並沒有地心說準確。)
3. 大量準確的數據對研發很重要。
4. 正確的模型也可能受噪音干擾,而顯得不準確;這時我們不應該用一種湊合的修正方法來彌補它,而是要找到噪音的根源,這也許能通往重大發現。

在網絡搜索的研發中,我們在前面提到的單文本詞頻/逆文本頻率指數(TF/IDF) 和網頁排名(page rank)都相當於是網絡搜索中的“橢圓模型”,它們都很簡單易懂。 
發佈了3 篇原創文章 · 獲贊 4 · 訪問量 10萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章