總結 | 北京城市氣象研究所範水勇:數值天氣預報介紹

AI 研習社按:「AI Challenger 全球 AI 挑戰賽」是面向全球人工智能人才的開源數據集和編程競賽平臺,本次 AI 大賽氣象賽道應用了一個很重要的數據源-「睿圖」預報數據,睿圖就是北京市氣象局數值天氣預報體系。

在本次公開課中,嘉賓將分享數值天氣預報的現狀、睿圖數值天氣預報體系的情況以及睿圖預報數據的介紹,使聽者對數值天氣預報本身以及「睿圖」預報數據有所瞭解。

分享嘉賓:

範水勇,中國氣象局北京城市氣象研究所,副研究員,主要研究方向是數值天氣預報系統開發和應用

公開課回放地址: http://www.mooc.ai/open/course/578?=Leiphone

分享主題:數值天氣預報介紹

分享提綱:

  • 什麼是數值天氣預報
  • 「睿圖」數值天氣預報系統介紹
  • 「睿圖」預報數據怎麼做出來的

AI 研習社將其分享內容整理如下:

衆所周知,大氣系統是很複雜的,主要具有這幾種特徵:非線性、多尺度、多圈層和多種強迫和反饋,此外,大氣系統還是動力、物理和化學的綜合。對於大氣系統的多變性,著名氣象學家 Charney 在 1951 年說過:「大氣並沒有向我們展現出類似潮汐變化那種類型的週期性,因此我們無法採用像潮汐預報那樣的方法來預報天氣。我們沒有發現大氣在某一特定時刻的狀態與另一時刻的狀態之間存在一系列的簡單因果關係。」

我們的氣象預報主要解決以下三方面的問題:當前的天氣或氣候信息、天氣或氣候的演變規律以及從已知預報未來的手段。在未有數據預報以前,天氣預報主要建立在地面與少數高空觀測基礎上的主管技術,比如下圖便是 1944 年美國氣象學家用來做天氣預報的天氣圖。

這種預報比較主觀,對於極端天氣的預報時效很少會超過 12 個小時。

我們對天氣預報的定義,是應用大氣變化的規律,根據當前及近期的天氣形勢,對未來一定時期內的天氣狀況進行預測。預測主要根據對衛星雲圖和天氣圖的分析,結合有關氣象資料、地形和季節特點、羣衆經驗等綜合研究後作出的。

業內主要默認有三種基本的天氣預報模式:第一種是根據天氣學原理和經驗建立的,以物理定性關係爲主的天氣學模式;第二種是由當前氣象要素與未來天氣之間的統計關係建立的統計學模式;第三種則是利用當前氣象要素的分佈與未來天氣之間的物理定量關係建立的動力學模式。簡單進行總結的話,第一種模式對應的是天氣圖方法;第二種模式對應的是統計預報方法;第三種模式對應的是數值預報方法。

第一種天氣學方法與第二種統計學方法都屬於傳統方法的範疇,其侷限在於無法滿足客觀、定量、準確的分析需求。

爲了解決天氣預報的難題,業界採用了一種可行性較高的方法:首先、把大氣的演變規律近似表示爲一組數學方程式;第二、根據從有限觀測中得到的當前大氣的初始狀態;第三、在已知或設定的強迫條件(包括邊界條件)下,通過求解這一組方程的解,得到對未來的天氣或氣候狀況的預報;最後、由於方程組的複雜性,難以求出其解析解(精確解),只能藉助於高性能計算機用數值方法近似求解。這一系列步驟構成了我們如今的天氣預報系統。

我們一般將數值天氣預報稱作 NWP(numerical weather prediction),指的是根據大氣實際情況,在一定的初值和邊值條件下,通過大型計算機作數值計算,求解描寫天氣演變過程的流體力學和熱力學的方程組,預測未來一定時段的大氣運動狀態和天氣現象的方法。

從這個解釋來看,就會發現數值天氣預報與過往天氣學模式預報的不同。

它是一種定量的和客觀的預報,因此,數值天氣預報首先要求建立一個較好的反映預報時段的(短期的、中期的)數值預報模式,以及誤差較小、計算穩定並相對運算較快的計算方法。其次,由於數值天氣預報要利用各種手段(常規的觀測,雷達觀測,船舶觀測,衛星觀測等)獲取氣象資料,因此,必須恰當地作氣象資料的調整。

如果按預報時間長短給天氣預報做分類,我們可以分爲以下幾種:

  • 0-2 小時 臨近預報
  • 2-12 小時 甚短期預報 (短時預報)
  • 12-48 小時 短期預報
  • 3-10 天 中期預報
  • 10 天以上 長期預報

數值模式預報系統的運作原理

在未有數值天氣預報以前,傳統的天氣分析過程由觀測——資料收集——填圖——手工繪圖——過程分析——主觀天氣預報組成。在引入數值模式以後,天氣分析流程變成了觀測——資料收集——輸入電腦——資料初始化——模式模擬——客觀再現歷史天氣或預報未來天氣。

通過數值模式,我們可以將初始狀態的數值轉爲爲對未來狀態的預報,不過對操作的人有一定要求,那就是必須對演變規律有綜合理論的認識。

形象點來說,天氣預報的原理是先有一個大氣綜合探測系統,通過資料同化系統利用探測資料對預報系統進行初始化,將大氣變爲三維立體空間的一個個格點,然後通過對逐一格點求解形成一組數學方程組,接着在大型計算機上進行逐時刻「推算」,最終獲得未來的天氣演變情況。

數值模擬系統的一共有 5 個組成部分,分別是:

  1. 客觀分析和資料同化系統——主要解決從觀測資料到模式可用資料的轉換和優化。
  2. 初始化過程——去除資料中的干擾。
  3. 數值模式—一組數理方程組 (幹模式)
  4. 物理過程參數化——描述大氣中輻射、行星邊界層、積雲對流、海氣相互作用、微量氣體等(溼模式)。
  5. 數值產品的後處理——包括分析診斷再加工各類產品、圖形化顯示。

具體的數值預報系統流程,我們可以參考下圖:

至於哪些必要條件是開展數值預報的必備,我們總結出了 3 點:性能相宜的計算機、良好的通信條件,保證實時原始資料的供應以及較好的數值模式。

不誇張的說,數值預報產品的應用改變了預報業務的傳統工作程序和思路。

按照傳統的天氣預報思路,我們會先從實況形勢分析入手,採用運動學方法和物理分析等方法作出形勢預報,而且通常先作高空形勢預報再作地面形勢預報,着重報出高空、地面影響系統的強度變化和移動情況,然後在形勢預報的基礎上再作具體的要素預報。

而有了數值預報產品以後,形勢預報準確率已明顯高於人工主觀預報,預報員的重點是在數值預報的基礎上,運用天氣學. 動力氣象學等有關知識和天氣實況、衛星雲圖等資料的演變情況,判斷數值預報結果是否有明顯的不合理現象——如果沒有,就會使用數值預報的結果:如果有,則做出訂正預報。

數值模式預報系統的發展歷程

我給大家科普下數值預報在發展過程當中的一些里程碑事件:

數值預報概念在 1904 年由挪威科學家 Bjerknes 提出,經過不停發展,在 1950 年由美國 Charney 成功實現 24 小時的預報天氣形勢預報,後來隨着計算機技術和數值技術方法的不斷進步,又獲得了更大的發展。

中國的數值預報發展要稍微晚一些。

我們是從 1954 年纔有關相關的理論研究,1965 年推出北半球數據預報產品。如上圖所示,從 50、60 年代開始,我國每年都有新模式提出,基本上都是一些覆蓋大範圍的全球性預報。直到 1997 年我國正式推出中尺度數值天氣預報系統,行業纔算正式步入新階段。

中尺度數值模式得到全球的大力發展應用,其中最著名的是美國大氣研究中心 NCAR、國家環境預報中心 NCEP 等多單位聯合建立發展的 WRF(Weather Research and Forecasting Model),其次則是美國國家環境預報中心 ( National Centers for Environmental Prediction,NCEP) 用於業務預報的 ETA( η) 模式。

其他由美國主導的中尺度數值模式尚有:

  • 美國賓夕法尼亞大學和美國國家大氣研究中心 (PSU/ NCAR) 合作研製的 MM5( Mesoscale Model 5) 模式;
  • 美國科羅拉多州立大學 (CSU) 研發的區域大氣模擬系統 RAMS ( Regional Atmospheric Modeling System)。
  • 美國俄克拉何馬大學 (OU) 研發的區域預報系統 ARPS(Advanced Regional Prediction System);
  • 美國北卡州立大學的中尺度大氣模擬系統 MASS ;
  • 美國空軍全球天氣中心(AFGWC)的重置窗口模式 RWM 模式;
  • 美國海軍業務區域預報系統 NORAPS6;
  • 美國 NCEP 的區域譜模式 RSM 模式;
  • 美國海軍艦隊數值氣象和海洋中心(FNMOC)的耦合海洋/大氣中尺度預報系統 COAMPS

其他國家也各自開發了獨立的數值預報模式,當中較有名的包括:

  • 歐洲:ECMWF(歐洲中心中長期預報業務模式)
  • 法國: MESO-NH 模式 (中尺度非靜力模式);
  • 日本: JRSM 模式 (日本區域譜模式)
  • 英國: UKMO 模式 (英國氣象局業務中尺度模式);
  • 加拿大: MC2 模式 (中尺度可壓縮共有模式)
  • 中國: GRAPES-meso(全球/區域同化預報系統 Global/Regional Assimilation and Prediction System,中尺度版)

其中由美國大氣研究中心 NCAR、國家環境預報中心 NCEP 等多單位聯合建立發展的 WRF 模式,是目前全球使用最廣泛的中尺度數值模式。

所謂的 WRF(Weather Research and Forecasting Model)模式,是新一代非靜力平衡、高分辨率的中尺度數值模式。這種模式結合先進的數值方法和資料同化技術,採用經過改進的物理過程方案,重點考慮從雲尺度到天氣尺度等重要天氣的模擬及預報。

按照不同的動力框架,我們可以將 WRF 分爲 ARW(the Advanced Researched WRF)和 NMM(the Nonhydrostatic Mesoscale Model)。前者由 NCAR 的 MM5 發展而來,多用於研究;後者由 NCEP 的 Eta 發展而來,多用於業務預報。

自 2000 年初推出第一個版本以來,WRF 目前已更新至 4.0 版本,距離第一代已有 18 年的歷史。

睿圖數值預報系統

睿圖數值預報系統英文簡稱爲 RMAPS-ST,中文全稱「快速更新多尺度分析和預報系統-短期預報子系統」。「睿圖」實際上是個龐大的預報體系,我們將着重介紹短期預報子系統 RMAPS-STv1.0 系統,該系統已在 2017 年 5 月業務應用於北京氣象局。

MAPS-STv1.0 系統一共有兩層嵌套區域,第一層分辨率達 9 公里,範圍覆蓋了全中國;第二層分辨率達 3 公里,主要覆蓋華北區域。MAPS-STv1.0 系統的預報流程從世界時 00 時開始,一直持續至 21 時,根據不同業務預報需求,預報時效會有相應調整。系統每隔 3 小時快速獲取一次常規觀測資料(GTS)和中尺度觀測資料(地基 GPS、自動站、雷達飛機觀測等),主要用於資料同化程序。

下圖是 MAPS-STv1.0 系統的資料分佈情況,其中包括了常規的探空、地面、飛機報和自動站的分佈(東部最爲密集);另外還有地面 GPS 資料(同樣東部最爲密集);以及針對強對流天氣預報的雷達資料分佈。

與前一代預報系統 BJ-RUC v3.0 相比,MAPS-STv1.0 系統在很多方面都有了很大進步,其中包括模式版本、模式分辨率、預報範圍、預報框架、資料同化技術性能、物理方案等,這些都是預報系統比較關鍵的參數。

MAPS-STv1.0 系統每天將有 8 次預報,實際的啓動時間要比正常時間滯後 1 小時 15 分鐘。根據不同業務的預報需求,系統將有相應的預報時效安排。如下圖所示,00 點、03 點的預報時效要長一些,其次爲北京時間 12 點。

由於網格覆蓋範圍較大,因此對計算量的需求也變得更高,一般需要 40 分鐘至 2 個小時來完成所有預報流程——系統約滯後 2 小時可以看到前 12 小時的預報產品、約滯後 2 小時 15 分中可以看到 24 小時的預報產品。

爲了維持數值預報的正常運算,系統採用了曙光高性能計算機,其計算峯值達到了 90 萬億次。其次,爲了應付數值預報的海量數據,系統採用的都是上百 TB 的存儲系統。

這裏給我們的網站打個廣告——www.ium.cn/rmaps,我們會在這裏發佈我們的天氣預報產品,此外,網站上還能看到三天內的天氣預報,預報的數據包含:降水量、溫度、雲層、強對流天氣等。

爲了保證預報數據的準確性,我們會通過一些統計學方程式來檢驗我們的系統預報性能。

下圖結果顯示,系統的 2 米溫度的均方根誤差在 1.7 度到 2 度之間;10 米風的均方根誤差在 1.9 到 2.1 米/秒之間。總而言之,數據偏差基本都在可控範圍之內。

AI Challenger 2018 全球 AI 挑戰賽——-「睿圖」預報數據

對於本次競賽的睿圖數據的製作,我們將提供兩款數據集:

1)用於訓練學習的歷史預報數據集

——採用北京時間 11 點(世界時 03UTC)起始的預報

——預報時效 36 小時,數據時間間隔 1 小時

——原始預報是三維格點數據,netcdf 格式

——包含地面和特徵氣壓層共計 29 個氣象要素

——10 個觀測站點,約 3 年預報樣本

2)雙週賽所使用的實時預報數據集

——格式、變量等與歷史預報數據集相同

——實時預報數據的生成滯後 3 小時

我們先獲取模式格點預報數據,然後通過處理軟件插值到站點上,以形成站點要素預報;接着把北京自動站逐小時觀測資料讀取相應站點要素,形成站點要素觀測數據,最好將兩個數據合成包括站點要素預報和觀測的數據集(netcdf 格式),最後發給大家。

我今天的分享內容就到這裏,謝謝大家。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章