博士論文的誕生,1988年最重要的科學發明-新書選載

“什麼是做博士的目的?”在我選定研究方向,正準備挽起袖管大幹一番的時候,我們的院長尼科·海博曼問了我這個問題。我想都沒想,脫口而出,“就是在某一個領域做出重要的成果。”“不對。”尼科·海博曼教授不假思索地否定了我。他告訴我,“讀博士,就是挑選一個狹窄並重要的領域作研究,畢業的時候交出一篇世界一流的畢業論文,成爲這個領域裏世界首屈一指的專家。任何人提到這個領域的時候,都會想起你的名字。”

  海博曼教授的“做世界某一個領域的一流”的觀點,讓我十分震驚,我從未奢望在20多歲時走到某個領域的頂峯,但是這種“要做就要做到最好”的激勵,我始終銘記在內心深處。

  看到了我的興奮,海博曼教授問我:“你懂了嗎?”我說:“懂了,我從卡內基·梅隆大學將帶走的就是這份改變世界的、頂尖的博士論文。”他又說:“不對,你從學校帶走最有價值的不是這份論文,而是你分析和獨立思考的能力、研究和發現真理的經驗,還有科學家的胸懷。當你某一天不再研究這個領域的時候,你依然能在任何一個新的領域做到最好。”這番話引起了我深深地思索,也再一次印證了“沉澱下來的纔是教育”這句話的意義。學習成績只是一種表象的結果,而學習能力纔是伴隨一生的能力。

  1983年10月,我走進語音識別的世界。開始和瑞迪教授一起探討語音識別領域裏現有的成果以及如何突破的可能性,瑞迪說,“你來做一個不特定語者的語音識別系統吧。”當時這在世界上是一個無解之謎。

  所謂不特定語者的語音識別就是說讓電腦能夠聽懂每一個人說出的話,並且識別出來,最後希望達到的最理想狀態就是讓機器對人的語言有所反應,最終達到“人機對話”的理想程度。在我當時所處的年代,人們所做的語音識別系統研究,還只能識別一個人的聲音,也就是“特定語者”的研究。因此,瑞迪教授對我的期望就是讓我把這個研究成果擴展出來,形成突破,讓機器對更多的人的語言識別率提高。

  瑞迪告訴我,“我覺得專家系統是解決不特定語者問題最好的方法,這也是最火的新技術。希望你試試。去吧,小夥子,盡情做你的研究,我這裏有科學基金的研究經費,因此你不用擔心錢的問題。” 在巨大的期望下,瑞迪把課題的接力棒交給了我。

  經過數月的鑽研,我把整個研究過程寫了篇論文發表出來,得到了正面的回饋。第一次,人們知道,在有限的領域和單一的語者身上,專家系統研究出來的機器語音識別率可以達到95%。這意味着,人和機器可以進行簡單的對話了。那段時間,瑞迪開心得不得了,並且更加堅信“專家系統”的方法是個正確的選擇。

  儘管面對一片好評,我卻顯得非常沉默。其實,這個時候我內心的擔憂早已開始慢慢滋長了。因爲,在研究的過程中,我已經發現專家系統的前景非常不明朗,因爲機器經過很長時間的訓練,只能聽懂特定20個訓練者的語音。而人與人說話的音節和語調千變萬化,只要換了另外100人的聲音重新檢驗原來的研究成果,其識別率立即下降到不能想象的地步,只有30%左右。而且,我們僅僅用了26個詞作爲詞彙,一旦增加詞彙,整個系統就將崩潰。

  1984年暑假即將來臨,我正沉浸在自己課題的十字路口上,不知道何去何從。這個時候我遇到了我的一個師兄彼得·布朗(Peter Brown),他看到我愁眉不展,就把我叫到一間教室裏,在黑板上寫了幾個統計學公式。彼得·布朗對我說,“開復,我知道你在做語音識別,並且爲之苦惱,但是你爲什麼不嘗試一下統計學的方法呢,從統計中抽取數據我想應該能夠提高語音識別率,你覺得呢?”


  所謂統計學的方法,就是從龐大的數據庫中進行歸類,通過特徵的歸納使得數據通過“分類器”,得到結果的一種方法。對於是否能用大量數據庫對聲音進行統計,我心中充滿了好奇與問號。而用統計學方法來研究語音識別的想法,開始在心中慢慢地滋生。

  就在我暑期忙着教書,秋天投身奧賽羅時,瑞迪教授從美國國防部得到了300萬美元的經費做不指定語者、大詞庫、連續性的語音識別。也就是說,他希望機器能聽懂任何人的聲音,而且可以懂上千個詞彙,懂人們自然連續說出的每一句話。這三個問題都是當時無解的問題,而瑞迪教授大膽地拿下項目,希望同時解決這三個問題。他在全美招聘了30多位教授、研究員、語音學家、學生、程序員,以啓動這個有史以來最大的語音項目。而他也期望我在專家系統方面繼續努力,得到突破,在這30多人的隊伍裏面發揮作用。

  但是,他怎麼也沒想到,我正想着如何脫離這個30多人的隊伍,脫離專家系統的研究。奧賽羅的人機博弈,讓我對統計概念有了充分的理解,我開始相信,建立大型的數據庫,然後對大的語音數據庫進行分類,就有可能解決專家系統不能解決的問題。

  怎樣向他提這件事?我一直在猶豫,他已經向國防部立項,經費已經到位,專家系統的方向是勢在必行的,我是他一手調教出來的大弟子,如果我這麼不配合他的方向,他會怎麼處理呢?會試着說服我繼續做專家系統?會大發雷霆?還是會好言相勸?

  再三思考後,我告訴自己,我必須向他坦承我的看法,因爲我想起當時海博曼院長對我說的:“讀博士,就是挑選一個狹窄並重要的領域作研究,畢業的時候交出一篇世界一流的畢業論文,成爲這個領域裏世界首屈一指的專家。任何人提到這個領域的時候,都會想起你的名字。”如果我做專家系統,我就愧對了海博曼院長的期許,也浪費了我大學三年苦讀,更對不起我自己。

  於是,我決定鼓足勇氣,向瑞迪教授直接表達我的想法。我對瑞迪說:“我希望轉投統計學,用統計學來解決這個‘不特定語者、大詞彙、連續性語音識別’。”

  瑞迪一點都沒有生氣,他輕輕地問:“那統計方法如何解決這三大問題呢?”這正是我思考很久的三個問題。然後,我就長篇大論地說了十分鐘,瑞迪教授耐心地聽完我激情的回答後,用他那永遠溫和的聲音告訴我:“開復,你對專家系統和統計的觀點,我是不同意的,但是我可以支持你用統計的方法去做,因爲我相信科學沒有絕對的對錯,我們都是平等的。而且,我更相信一個有激情的人是可能找到更好的解決方案的。”

  那一刻,我的感動無以倫比。因爲對一個教授來說,學生要用自己的方法作出一個與他唱反調的研究。教授不但沒有動怒,還給予經費上的支持。這在很多地方是不可想象的。

  但是,統計學需要大數據庫,我們如何才能建立起大的數據庫呢?瑞迪教授看到我愁眉不展的樣子,再一次給了我支持。他說,“開復,雖然說我還是對你的研究方法有所保留,但是,在科學的領域裏,其實也無所謂老師和學生的區別,我們都是面臨這一個難題的攻克者,所以,如果你真的需要數據庫,那麼,讓我去說服國防部去幫你建立一個大的數據庫吧!”

  統計學的方法也需要非常快的機器,瑞迪教授幫我購買了最新的Sun 4機器。每次有新的機器,他都會說:“先問問開復要不要。” 做論文的兩年多,我至少花了他幾十萬美元的經費。

  瑞迪教授的寬容再次讓我感覺到一種偉大的力量,這是一種自由和信任的力量。伏爾泰曾說:“我可以不同意你的觀點,但是我誓死捍衛你說話的權力! ”瑞迪教授這樣說:“我不同意你,但是我支持你。” 這是一種真正的科學家的精神。他這種“科學麪前,人人平等”的信念,深深地影響了我。這種無言的偉大,讓我受益終生,也讓我以這種信念對待他人的不同意見。

  24年後,當我的員工郭去疾離職的時候,他是這麼描述我的:“8年來,作爲我的師長,開復很多次支持了我的理想,改變了我的命運,也寬容了我的缺點。當你離一個人很近,從他身上學到太多,你可能反而不知道該怎樣總結你的收穫。但我知道,現在當我遇到一個難以處理的困難,我常常會去想,如果是開復,他會怎麼做。假如只能選一條收穫來分享,那麼開復讓我銘記終身的教益是:‘You can sincerely disagree and full heartedly support at the same time(你可以同時真誠地反對和全力地支持)。’以前讀到開復的文章裏提及他的博士導師懷疑卻又支持他的研究方向的時候,我以爲那只是一種雅量。而當開復身體力行地一次次懷疑卻又支持我的時候,我才慢慢明白這是一種珍貴的領導力。”

  這種領導力只能歸功和感謝我的導師,瑞迪教授。

  在導師的這種力量的支持下,我開始了瘋狂的科研工作。從1984年底到1987年初,我帶着另一位學生一起用統計的方法做語音識別。同時,其他30多人用專家系統做同樣的問題。從方法上來說,我們在競爭,但是在瑞迪教授的領導下,我們分享一切,我們用同樣的樣本訓練和測試。在瑞迪教授的支持下,我也慢慢得到了其他教授的認可。1987年5月,我們大幅度地提升了訓練的數據庫,我又想出了一種新的方法(triphones)來建模,不但能夠用統計學的方法學習每一個音,而且可以用統計學的方法學習每兩個音之間的轉折。針對有些音的樣本不夠,我又想出了一種方法(generalized triphones)來合併其他的音。這三項工作居然把機器的語音識別率從原來的40%提高到了80%!此後,我繼續孜孜不倦地做着各種實驗和統計,機器的語音識別率居然提高到了96%!1988年4月,我受邀到紐約參加一年一度的世界語音學術會議,發表學術論文。我給系統取了名字,叫做Sphinx(希臘的人面獅身)。希臘的人面獅身有人的臉孔、獅子的身體、鳥的翅膀,我取這個名字是希望獅子的身體代表宏偉的統計模型,人的臉孔代表人的語音知識,鳥的翅膀代表系統的速度。在這個會議上,我把96%的語音識別率發表了,也演示了Sphinx系統。結果就像瑞迪教授所預期的,學術結果和演示效果相映之下,我的成果撼動了整個學術領域。這是計算機領域裏最頂尖的科學成果了。語音識別率大幅度提高,讓全世界語音研究領域閃爍出一道希望的光芒,從此,所有以專家系統研究語音識別的人全部轉向了統計方法。

  會後,《紐約時報》聽說了這個成果,派記者約翰·馬可奧夫(John Markoff)來到匹茲堡對我作了採訪,文章發表於1988年7月6日,佔了科技版首頁的整個半版。在這篇文章裏,馬可奧夫大力報道了我的論文的突破。當時,我只覺得在和一個和藹可親的記者聊天,事後,我才知道這是一名才華橫溢的著名記者,三次提名普利策獎,並在斯坦福兼教。後來,《商業週刊》把我的發明選爲1988年最重要的科學發明。年僅26歲初出茅廬的我,第一次亮相就獲得這樣的成功,讓我感到很幸運,也讓我有了繼續向科技高峯攀爬的動力。

  

              紐約時報對我的博士論文的報道

 

 

注:本文摘錄自我的新書《世界因你不同》,未來一段時間,我會摘錄其中的小故事來跟大家分享。

--------------------------------------------------------------------------------------------
    這是李開復唯一的一本自傳,字裏行間,是歲月流逝中沉澱下來的寶貴的人生智慧和職場經驗。搗蛋的“小皇帝”,11歲的“留學生”,奧巴馬的大學同學,26歲的副教授,33歲的蘋果副總裁,谷歌中國的創始人,他有着太多傳奇的經歷,爲了他,兩家最大的IT公司對簿公堂。而他的每一次人生選擇,都是一次成功的自我超越。
     透過這本自傳,李開復真誠講述了他鮮爲人知的成長史、風雨兼程的成功史和燭照人生的心靈史,也首次全面披露了他親歷的蘋果、微軟、谷歌等IT巨頭風雲變幻的內幕。意真情切,字字珠璣。

    抓住一切去探尋生命的意義,總有一天,世界將因你不同。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章