科研最好的時代還是最差的時代？儘管AI一騎絕塵，但科學正放緩

來源：theatlantic.com

編輯：大明、三石

【新智元導讀】AI正在大爆發，但總體而言，按單位成本投入和人均成果來看，科學發現的效率正在下降：諾獎獲得者的年齡提高了10歲、一個重要發現需要數十人的努力。究竟是哪裏出了問題？

“科學發現纔是唯一的新聞”。

這是作家斯圖爾特·布蘭德（Stewart Brand）的一句名言。

雖然新聞內容由政治、經濟和娛樂八卦主導，但科學和技術纔是人類福祉和文明長期進步的基礎。現在，無論是科學家的數量、科學資助的規模，還是發表的科學論文數量，都比以前有大幅提升，因此也推動着人類各項事業的繁榮。

從表面上看，這無疑是令人鼓舞的。但是，在這些指標迅速增長的同時，我們對科學的理解是否取得了與之相應的進步？還是我們僅僅爲了維持（甚至降低）科學進步的速度本身，投入了更多的資源？

《大西洋月刊》The Atlantic最近發佈了一篇題爲“Science Is Getting Less Bang for Its Buck”的文章，認爲雖然像AI或者基因編輯這樣的科技正在大爆發，但總體而言，科學發現的效率正在降低。

文章主要有幾個有趣的觀點：

自1990年以來的成果很少獲諾獎，自1990年以來的成果僅獲得三次諾貝爾獎。
在諾貝爾獎的早期，科學家獲獎的平均只有37歲，而現在則到了平均47歲。
原子核被發現的時候，論文作者只有一位；希格斯粒子在2012年被發現的時候，相關的兩篇論文各自擁有大約1000名作者。
AI和基因編輯技術大爆發，但按單位成本或人均指標來看，科學研究的效率正在下降。

爲什麼科學發現會變得如此昂貴和“低效”？

諾貝爾獎有偏見？強烈偏向早期研究成果，1990年代獲獎較少

《大西洋月刊》進行了一項調查，要求科學家們比較其所在領域的諾貝爾獎獲獎成果，然後使用這些排名信息，來確定科學家們對諾貝爾獎獲獎成果的質量在過去幾十年中的變化情況。

對於物理學獎，《大西洋月刊》調查了來自世界頂級學術物理系的93位物理學家（根據上海世界大學排名），請他們判斷了1370對發現。

下圖中的條形圖顯示了每十年的諾獎發現的評分。得分越高，說明評分者認爲這個時段的發現比其他時段的發現更重要的可能性越大。請注意，統計是按發現的年份，而不是獲獎年份。

20世紀的頭十年的表現不盡如人意。這十年中，諾貝爾獎委員會仍在探索這個獎項獎勵的是什麼。比如現在有一個獎項，頒發給了能夠更好地照亮海面的燈塔和浮標。如果你在船上航行，這無疑是個好消息，但它與現代物理學的關係不大。在20世紀最初十年，諾貝爾物理獎大多獲獎成果符合現代物理的概念。

從1910年，到20世紀30年代是物理學發展的黃金時代。這是量子力學的時代，量子力學是有史以來最偉大的科學發現之一，從根本上改變了我們對現實的理解。量子力學還引發了了其他幾項革命：X射線晶體學的發明，讓我們得以探索原子世界。中子和反物質被發現。關於放射性和核力量的許多基本事實被發現。這是科學史上的最偉大的時期之一。

在此之後，評分出現了大幅下降，直到20世紀60年代出現部分回升。這主要是由於兩個發現：宇宙 - 微波 - 背景輻射，以及粒子物理學的標準模型的建立，讓我們發現了構成宇宙的基本粒子和力的最佳理論。即使憑藉這些發現，從20世紀40年代到80年代，物理學家對這期間的諾獎成果的評價都要比從1910年代到1930年代中最低的十年評分更低。

圖表數據截止到在20世紀80年代末。原因在於，近年來，諾貝爾獎委員會更願意爲產生於上世紀70-80年代的成果頒獎。事實上，自1990年以來的成果僅獲得三次諾貝爾獎。這個數量太少了，無法對20世紀90年代的發現進行高質量的估計，因此我們沒有對這些成果進行調查。

然而，自1990年以來的成果很少獲獎這個事實本身就具有啓發性。諾貝爾獎委員會傾向於跳過這幾十年，爲誕生時間更早的成果頒獎。鑑於20世紀70-80年代本身看起來就並不那麼好，這對物理學來說是個壞消息。

物理學表現不佳，或許其他領域的情況好一些？《大西洋月刊》對諾貝爾化學獎和諾貝爾生理學或醫學獎進行了類似的調查。以下是評分：

可以看到，結果比物理學獎稍好，在20世紀下半葉的評分比物理學獎可能略有改善。但與物理學獎一樣，20世紀90年代和2000年以後的成果被省略了，因爲諾貝爾獎委員會強烈偏向早期的研究成果：在20世紀90年代和2000年代完成的成果的獎勵少於之前任何一個年代。

這項調查描繪出了一幅黯淡的場景：在過去的一個世紀裏，我們大大增加了投入科學研究的時間和金錢，但在科學家自己的判斷中，我們取得最重要的新突破的速度基本保持不變。按單位成本或人均指標來看，科學研究的效率正在下降。

當然，有人可能會說，諾貝爾獎成果的質量與科學進步的總體速度不是一回事！

這項調查當然有很多侷限之處：諾貝爾獎沒有包含一部分科學門類，特別是計算機科學等新興領域；諾貝爾獎委員會偶爾也會錯過重要的成果；也許一些偏見意味着科學家們更有可能尊重年頭更長的成果；也許更重要的是更大量的科學成果，即構成大部分的普通科學發現。

這些侷限確實存在，但是，我們很快就會看到有證據表明，全面的、重要的科學發現變得越來越困難。這需要更大規模的團隊協作和更廣泛的科學訓練。

總之，這些結果表明，我們在科學上付出的努力，其回報率正在大幅下降。

科學家獲獎年齡增加近10歲，過於關注已確立的領域導致科學進展困難

除了領域的維度，還有其他維度。

經濟學家本傑明•瓊斯（Benjamin Jones）和布魯斯•溫伯格（Bruce Weinberg）研究了科學家們在做出重大發現時的年齡。

他們發現，在諾貝爾獎的早期，科學家在獲得諾貝爾獎的時候平均只有37歲。但最近這一數字上升到平均47年，相當於科學家職業生涯的四分之一。

也許今天的科學家需要懂得更多的知識才能做出重大發現。因此，他們需要學習更長的時間，所以在較爲年長的年齡才能完成他們最重要的工作。也就是說，偉大的發現越來越難以實現，這就意味着它們的數量會減少，或者需要更多的努力。

同樣的道理，現在的科學合作所涉及的人數比一個世紀前要多得多。當歐內斯特·盧瑟福在1911年發現原子核的時候，他所發表的論文中，作者只有一位，那就是他自己。相比之下，希格斯粒子在2012年宣佈被發現的時候，相關的兩篇論文各自擁有大約1000名作者。

平均而言，在20世紀，研究團隊的規模幾乎翻了兩番，而且這種增長一直持續到今天。對於許多研究問題，它需要更多的技能、昂貴的設備和一支龐大的團隊才能在今天取得進展。

如果科學變得越來越難是真的，爲什麼會這樣呢?

假設我們認爲科學，類似於對新大陸的探索。在早期，人們對此知之甚少，探索者很容易地開始並發現主要的新特性，但他們逐漸填補了新大陸的知識。

要想有重大發現，探險者必須在更加困難的條件下去更加偏遠的地區，探索變得困難。按照這種觀點，科學是一個有限的前沿領域，需要付出更多的努力才能“填滿地圖”。總有一天地圖將接近完整，科學將在很大程度上被耗盡。從這個觀點來看，任何發現困難的增加都是科學知識結構本身固有的。

但是有一種不同的觀點，一種認爲科學是無止境的，在這種觀點中總是有新的現象要發現，有重大的新問題要回答。無限邊界的可能性是一種被稱爲“出現（emergence）”想法的結果。

以水爲例。用方程來描述單個水分子的行爲是一回事。要理解爲什麼天空中會形成彩虹，或者海浪的撞擊，或者彗星的起源，則完全是另一回事。所有這些都是“水”，但處於不同的複雜程度。

行爲的“出現”程度這一事實並不一定意味着會有無窮無盡的新現象有待發現、新的問題有待解答。但在某些領域，這似乎是可能的。

例如，計算機科學始於1936年，當時圖靈發明了數學模型，我們現在稱之爲圖靈機。那個模型非常簡陋，幾乎像一個孩子的玩具。然而，這個模型在數學上等同於今天的計算機：計算機科學實際上是從它的“萬物理論”開始的。儘管如此，自那以後，它還是看到了許多非凡的發現：諸如構成互聯網商業和加密貨幣基礎的加密協議等想法；編程語言設計中無窮無盡的美妙想法；更奇怪的是，最好的電子遊戲中也有一些富有想象力的想法。

這些是計算機科學中的彩虹、海浪和彗星。更重要的是，到目前爲止，我們的計算經驗表明，它確實是取之不盡用之不竭的，總是有可能發現美麗的新現象，新層次的行爲，這些行爲構成了新的基本問題，併產生了新的探究領域。計算機科學似乎是開放式的。

以類似的方式，隨着我們獲得編輯基因組、合成新生物體的能力，以及更好地理解生物體基因組與其形態和行爲之間的關係，生物學領域可能會繼續出現新的前沿。類似的事情也可能發生在物理和化學領域，比如可編程物質和新的物質設計階段。在每一種情況下，新的現象都會以一種開放式的方式提出新的問題。

因此，樂觀的觀點認爲，科學是一個無止境的前沿領域，我們將繼續發現甚至創造全新的領域，並提出自己的基本問題。如果我們今天看到增長放緩，那是因爲科學仍然過於關注已確立的領域，而在這些領域，取得進展變得越來越困難。我們希望未來會有更多的新領域出現，產生新的重大問題。這是科學加速發展的機會。

最好的時代還是最差的時代？AI和基因編輯技術正在大爆發

《大西洋月刊》內部在討論上述研究發現時，有不少人堅持認爲科學正在經歷一個黃金時代。他們拿希格斯粒子和引力波的發現爲例，以此作爲“科學比以往任何時候都更好”的證據。

這些發現確實是驚人的發現。但前幾代人的發現也同樣引人注目。例如，將引力波的發現與1915年愛因斯坦廣義相對論的發現相比較，廣義相對論不僅預測了引力波，而且從根本上改變了我們對空間、時間、質量、能量和重力的理解。引力波的發現雖然在技術上給人留下了深刻的印象，但對改變我們對宇宙的理解卻沒有多大幫助。

儘管希格斯粒子的發現是了不起的，但與20世紀30年代發現的衆多粒子相比，它就相形見絀了。這些粒子包括我們日常生活的主要組成部分之一中子，以及正電子，後者首次揭開了反物質的神祕世界。從某種意義上說，希格斯粒子的發現是非凡的，因爲它體現了20世紀上半葉常見的一種狀態，但近幾十年來很少見。

另一種普遍的反應是，人們說科學比以往任何時候都好，因爲他們自己的領域正在取得巨大的進步。比如現在經常聽到人工智能（AI）和crispr基因編輯技術。

但是，雖然人工智能、crispr和類似的領域的確在快速發展，不過如果放在整個現代科學史上觀察，一直存在着熱門或者更受歡迎的領域。

想想從1924年到1928年之間物理學的進步。在這段時間裏，物理學家瞭解到物質的基本成分既有粒子又有波的性質；他們制定了量子力學的定律，導致了海森堡的不確定性原理；他們預測了反物質的存在等等。正如保羅·狄拉克（Paul Dirac）所說，在那個時代，“即使是二流物理學家也能做出一流的發現”。

相比之下，過去幾年人工智能的主要發現，包括在識別圖像和人類語言能力上的提高，以及玩圍棋等遊戲的能力，將在未來幾十年產生巨大的影響。但要產生這些成果，需要付出更多的時間、金錢和努力，而且，目前尚不清楚，它們是否比20世紀20年代揭示的現實重組更重要。

同樣，crispr在過去幾年也取得了許多突破，包括修改人類胚胎以糾正一種遺傳性心臟疾病，以及製造出能夠在整個蚊子種羣中傳播瘧疾抗性基因的蚊子。但是，儘管這樣的實驗室原理證明是顯著的，crispr的長期潛力是巨大的，但最近的結果並不比過去生物學快速進步時期的結果更令人印象深刻。

70年代以來除了計算機和互聯網，其他許多技術只是在改進

如果科學的收益遞減，這對我們的長期未來意味着什麼呢？是否會有更少的新科學見解來激發在過去一個世紀中重塑我們世界的新技術呢？事實上，經濟學家認爲這種情況正在發生，他們稱之爲生產率放緩。

生產率的增長是經濟健康社會的一個標誌，人們不斷創造出能夠提高財富創造能力的想法。壞消息是美國的生產率增長正在下降。自上世紀50年代以來，這一數字一直在下降，當時大約是今天的六倍。這意味着，在過去10年裏，我們看到的變化與上世紀50年代18個月裏的變化差不多。

這聽起來可能令人驚訝。在過去的幾十年裏，我們沒有看到很多發明嗎？今天不是加速技術變革的黃金時代嗎?

經濟學家泰勒•考恩(Tyler Cowen)和羅伯特•戈登（Robert Gordon）辯稱，事實並非如此。在他們的著作《大停滯和美國成長的興衰》中，他們指出，20世紀初使用了許多強大的通用技術：電力、內燃機、無線電、電話、航空旅行、裝配線、化肥等等。

相比之下，他們整理的經濟數據表明，自上世紀70年代以來，情況幾乎沒有什麼變化。是的，我們已經取得了與兩種強大的通用技術相關的進展：計算機和互聯網，但其他許多技術只是在逐步改進。

是什麼導致了生產率的下降？經濟學家對這一問題存在爭議，並提出了許多不同的答案。一些人認爲，這僅僅是因爲現有的生產率衡量方法不能很好地衡量新技術的影響。

《大西洋月刊》提出了另一種解釋，即在科學上的支出回報的減少導致了真正的生產率放緩。

但即使很難評估科學工作的重要性，《大西洋月刊》認爲，仍有必要進行這樣的評估。

並不是說科學家需要強制的KPI，但社會需要依靠這些評估結果來獎勵科學發現，並決定應僱用或資助哪些科學家。

參考鏈接：

https://www.theatlantic.com/science/archive/2018/11/diminishing-returns-science/575665/?utm_source=feed

科研最好的時代還是最差的時代？儘管AI一騎絕塵，但科學正放緩

【新智元導讀】AI正在大爆發，但總體而言，按單位成本投入和人均成果來看，科學發現的效率正在下降：諾獎獲得者的年齡提高了10歲、一個重要發現需要數十人的努力。究竟是哪裏出了問題？

高效率使用windows

智能決策新時代：可視化大屏是否能夠超越傳統白板？

解密Prompt系列28. LLM Agent之金融領域摸索：FinMem & FinAgent

分享幾個.NET開源的AI和LLM相關項目框架

GitHub扒皮：中國996企業、外資955企業曝光，有你家公司嗎？

20幅漫畫預測未來：充斥機器人和無人機的世界！

2019年IEEE Fellow名單曝光：近百名華人入選，大陸學者30餘人

何愷明拋出重磅炸彈！ImageNet並非必要

“德州撲克AI之父”再發新論文：“冷撲大師2.0”要來了？

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結