在“雲”上做科研,是種什麼體驗?

  如今,做研究的人需要什麼?
  試管?文獻?電腦?如果再來一朵 “雲”會怎樣?
  別誤會,並不是讓科研人員上天做科研,而是——給他們一朵“中國科技雲”。
  <strong>大數據時代呼喚科技雲</strong>
  以“數據密集型”和“大數據”驅動的科學研究範式帶來了科研方法論的變革,正成爲科學發現的新引擎。
  數據與計算平臺已經成爲當代科學研究重要的信息基礎設施,並且將融匯貫穿於整個科學研究活動的全過程。<strong>近年來,幾乎在任何一項的重大科學發現和重大科技計劃中,數據與計算平臺都在扮演着無可替代的角色</strong> 
  <strong>2013 年諾貝爾化學獎</strong>
  2013 年諾貝爾化學獎授予了三位美國科學家,獲獎理由是"爲複雜化學系統創立了多尺度模型",對於化學家而言,多尺度計算化學模型的建立使計算機變得像試管一樣重要。從應用的角度而言,大規模的計算資源和大量的"黑箱"計算程序的出現使得越來越多的研究可以應用理論和計算的方法研究自然科學問題。
  <strong>2017 年諾貝爾物理學獎</strong>
  2017 年諾貝爾物理學獎授予了“首次探測到引力波”的三位美國科學家,在引力波的這一發現過程中,激光干涉儀前四個月的觀測數據量達 500TB,總共消耗了 17 億 CPU 核小時的計算資源對數據進行處理。
  <strong>2019 年第一張黑洞照片</strong>
  2019 年 4 月,200 多名科研人員通過 8 個分佈於全球的事件視界望遠鏡觀測點“捕獲”了黑洞的視覺證據。此項研究歷時 10 餘年,加州理工學院使用 Blue Waters 超級計算機超過 1000 個 CPU 覈對 3.5PB 的原始數據進行近 900 個黑洞合併的模擬,總共花費了 2 萬小時的計算時間。
  <strong>然而,現在許多研究人員所面臨的最大問題,不是缺少數據,而是面對太多的數據無從下手。</strong>
  人類社會從宏觀到微觀、從自然到社會的觀察、計算、傳播等活動,正在加速產生出海量且多樣的數據,數據呈現爆炸性增長:比如各種網絡社交信息數據,通過望遠鏡獲得的天文學圖片數據、各種各樣的基因序列數據、通過大型對撞機、光源等大型物理裝置產生的實驗數據等。這些數據類型複雜、數據量大、產生速度快、蘊含較大價值,同時已經超出了普通人的理解和認知能力。
  要從這些大數據中得到科學發現,需要適應大數據管理與處理的理論、技術和方法的產生,涉及對數據的整合、海量數據的處理、算法的優化、研究結論呈現等多個方面。
  在這種大的背景下,數據資源成爲了世界各國爭奪的新戰略資源,計算則成爲了衡量一個國家綜合國力和國際競爭力的重要標誌。數據與計算在科技領域的整體能力和應用,將集中體現一個國家的科技綜合實力。<strong>世界各國正加快建設以數據與計算爲主要特徵的信息化基礎設施,這必將深刻影響世界科技格局。</strong>
  幸運的是,我們有了中國科技雲。
  <strong>科學家自己的雲</strong>
  阿里雲、騰訊雲、百度雲……在雲計算廠商遍地開花的時代, 無論是阿里雲還是百度雲,都主要服務於商業活動。作爲一項專業性極強的研究活動,科研工作也需要一朵自己的“雲”。
  中國科技雲是<strong>網絡、數據與計算融合的新型國家信息化基礎設施,爲全國科技工作者提供科技資源及服務的發現、訪問、使用、交易與交付一體化雲服務,全面支撐多學科交叉的開放科學研究。</strong>
  通俗地講,中國科技雲就是把科學家要在各個網站上尋找的數據和計算工具整合在一個網站上,分門別類地提供給科學家,供科學家按需使用;同時,科學家也可以把自己的服務上傳到中國科技雲,供他人使用。<strong>簡而言之,這是“科學家自己的雲”。</strong>
  我們來看看這朵科技雲有什麼獨到之處?
  <strong>“專有”:</strong>中國科技雲以科研活動爲中心,以科研人員的使用習慣爲根本導向,在科學數據的存儲、傳輸、計算、分析、應用等各環節提供高效一體化的雲計算解決方案,不論是科研大數據快速共享發佈、科研專用的雲計算/超算服務還是可視化雲服務,都爲科學家基於大數據與大計算與科學研究提供了有力的支撐。可以說,這是爲科學家量身打造的專有科技雲。
  <strong>“開放”:</strong>這裏是海量資源匯聚的一站式服務平臺。中國科技雲持續開放,匯聚國內外優秀信息化基礎設施和服務,目前已實現 350P 的計算資源,150P 的存儲資源,以及 PB 級的科學數據資源的匯聚與服務。集成綜合平臺 52 個,各類科研軟件 409 款,可提供網絡服務、計算服務、存儲服務、數據信息等 9 大類典型的雲服務。門戶系統實現了資源服務的註冊管理與動態發佈,爲用戶提供在線申請、即開即用、按需擴展的柔性雲服務。
  <strong>“全球合作”:</strong>我國科學家基於中國科技雲前期工作基礎,開創性提出建立全球開放科技雲的倡議,得到了多區域的科學雲平臺的廣泛支持。目前,中國科技雲正在積極推進與歐洲網絡基礎設施、歐洲科研網等代表着歐開放科學雲核心基礎設施的機構,及美國全球科研交換中心的深化合作,啓動多邊先導計劃,共同開展技術、運行及政策研究,積極推進全球開放科學雲的建設。中國科技雲正在逐步成爲全球科技合作的重要紐帶和媒介。
  <strong>誰在用這朵雲?</strong>
  中國科技雲用戶羣體可覆蓋前沿與交通、能源、海洋、生命與健康等多個學科領域,科技工作者、服務提供者、資源提供者都可以在這朵雲上找到自己的位置。
  <strong>中國科技雲已經服務於“地球大數據科學工程”“空間科學”等先導專項,以及“中國天眼”FAST 望遠鏡、高海拔宇宙線觀測站(LHAASO)等重大科技基礎設施</strong>,支持了一系列超級計算、科學技術和人工智能和跨洲際的科學數據傳輸工作,正逐步成爲支撐科技創新發展的戰略性設施。
  正如中國科學院院士於貴瑞介紹中國科技雲在生態系統觀測中的應用時所說:“以前我們每做一個項目,都自己設計一個數據庫,項目結題後,這個數據庫也就廢棄了,資源浪費比較嚴重;現在把數據庫嫁接在中國科技雲上,就能夠不斷完善,逐漸形成一個龐大的系統。”他期待,未來能夠在中國科技雲上,構建面向生態科學研究的“生態科學雲”,實現生態科學研究各要素的有機融合,充分利用大數據、智能計算和可視化分析等新手段,加速科學發現的進程。
  <strong>怎麼加入(使用)科技雲?</strong>
  目前, “中國科技雲 2020 應用推進計劃”也啓動了,該計劃將通過公開徵集與擇優遴選等方式,爲有重大產出的科研項目免費提供計算資源等,提供的資源包括<strong>840 萬 CPU 計算機時、160 萬 GPU 計算機時、1000 臺雲服務器和 10PB 的雲備份,總價值 2800 萬元。</strong>
  首批入選的科研項目包括 FAST 仙女座大型漩渦星系中的脈衝星搜尋、人工智能深度挖掘宏基因組功能信息、高精度環境大氣感知與智慧雲預測系統、聚變等離子體物理與工程數據庫、國家冰川凍土沙漠科學數據中心、國家基礎學科公共科學數據中心等。
  <strong>未來,“六點”值得期待</strong>
  爲了給科學家提供更好的服務,中國科技雲也在不斷地更新升級中,2019 年 12 月 26 日,中國科技雲迎來了上線後的第一次升級,中國科技雲 2.0 正式發佈。中國科技雲項目負責人黎建輝研究員說:“未來一年裏,我們會面向科研需求,爭取至少每個月提供一款,爲科研、科學家定製的新服務。”
  未來,中國科技雲將通過技術創新和軟硬件設備持續升級,實現<strong>讓網絡再快一點、讓數據再多一點、計算力再強一點、存儲再大一點、應用面再廣一點,能夠爲更多領域的科研人員提供再好一點的服務,</strong>真正成爲支撐科技創新、驅動科學發展的加速器和倍增器。
  撰文:張文韜
  審覈:中國科學院計算機網絡信息中心
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章