2019美賽M(一等/優異)獎,給想參加美賽的同學們的乾貨建議

導讀: 我於2019年第一次參加美賽,最後獲得 Meritorious Winner 。結合賽前學長的分享與告誡,自己總結了些“套路”和“經驗”,在這裏以自己的B題爲例,把“乾貨”分享給同學們。近年來美賽名聲越來越差,文末我想簡單討論下參賽的意義。

1 建模思路與寫作技巧

獎項 2017年獲獎比例 2019年獲獎比例
Outstanding Winner 0.16% 0.14%
Finalist 0.27% 0.17%
Meritorious Winer 8.88% 7.09%
Honorable Mention 37.97% 15.35%
Successful Participant 51.55% 67.50%

如上,對於 H 獎來說,2019年美賽獲獎比例有明顯降低。那麼 H 獎和 M 獎的作品有什麼差別呢?如何脫穎而出,成爲前 7% 呢?我大概總結了以下五條:

  • 問題可能很模糊,但思路一定要明確
  • 模型要簡潔、清晰
  • 別忘了建模的目的——靈敏度分析很重要
  • 請拋棄各公衆號“百寶箱”,美賽國賽比拼的是快速學習的能力
  • 務必拋棄 word 排版,使用 LaTeX

1.1 把模糊的題目梳理清楚

近年來美賽的題目越來越怪(用隊友的話講,不怎麼好好出題了),很多很必要的、模型中很關鍵的條件都沒有給出,這很令人奇怪。但爲了拿下比賽,我們一定要快速做出假設,摒棄那些不重要和不明確的因素,把問題抽象爲一個容易讓評委理解的經典問題。 我以我2019年美賽和我們選擇的B題爲例。

2019年的題目是這樣的:

  • A:《權利的遊戲》中,如何養龍?提提建議唄。
  • B:波多黎各颶風后,無人機的偵查和物資運輸方案?
  • C:某藥品成癮與人口數據的關係?
  • D:盧浮宮發生恐怖襲擊,咋疏導?
  • E:如何幫助企業意識到,破壞環境是有成本的?
  • F:數字貨幣在金融體系中的可行性?

經過一天的糾結,我們隊伍最終決定選擇B題。原因有:

  1. 沒看過《權遊》、找不到盧浮宮的平面圖(不會CAD)、不懂數字貨幣,拋棄A、D、F;
  2. C題嘗試過,但當時我們還沒有數據處理的經驗,實在毫無頭緒;
  3. E要建一個評價模型,對於我們學經管的還是挺熟悉的,但是評價模型都比較玄學,難以評定模型建得好壞,並且需要讀大量英文文獻,工作量大;
  4. B雖然題目較長,但比較好抽象成經典的規劃問題、屬於傳統數學建模。

既然已經選擇了B題,那就沒有退路了。可是開始着手建模的我們傻了:這B題題目雖然長,但是衆多條件怎麼含含糊糊的?很多都要我們自己猜測檢索嗎?

對,就是要自己猜測。——這其實是近年來美賽比較奇怪的地方。

在這裏插入圖片描述

比如,題目中給瞭如上這個地圖,其中的信息實際上是很難提取的:

  • 地圖上有很多符號、數字,但卻沒有一個圖例,你甚至不知道這些信息代表着什麼;
  • 更重要地是,你不知道哪些信息對這道題有用;
  • 圖中的數字難道是海報高度嗎?那就是說建模時要建立三維座標系的路徑規劃?對於一個四天時間的比賽來說,簡直有點扯。

諸如此類的“題目信息不明確”還有很多: 比如給了飛機的數據(甚至包括電池指標),但是沒有給一個轉換公式,看來這些指標的轉換可以“隨意發揮”了;比如集裝箱是投放到災區的,還是事先在災區儲備好(以防萬一)的都沒有說明;比如飛機與藥品的裝箱形式要靠想象等等。

在比賽中我們經歷了很多糾結,我們甚至把題目中給的圖片的出處找到了,但是並沒有什麼幫助。現在回過頭看來,我們做的最有效的事,是把題目中要解決的問題很清晰地劃分成了四個子問題:

  • I 飛機評價模型:我們給飛機分工,建立指標評價,發現有些適合攜帶攝像機偵查、有些適合運送物資,最後選擇合適的“飛機套餐”;
  • II 裝箱模型:三維裝箱問題其實是世界級的 NP-hard 問題,這個應該是學界公認的,這裏 我們注意到了美賽建模是爲了解決實際問題,因此沒有使用那些純數學方法 (沒有只爲了得到數學上的最優解),而是 提供了一種工人可以操作的、評委容易看得懂的、直觀上給人沒有多少空間浪費的方法 (將藥品組合打包成長寬高比近似於集裝箱的立方體);
  • III 選址模型:我們假設災難發生後,只能投遞兩個集裝箱,便做了一個傳統的選址模型(投在哪裏合適?這其中考慮了偵查成本、藥品運輸兼顧性);
  • IV 路徑規劃模型:一共兩個路徑規劃模型,分別是物資運輸模型與攝像偵查路徑規劃。這是一個比較經典的 VRP 問題,我最喜歡的部分。爲了解決這類問題,列出一個大大目標函數,然後下面是你頭腦風暴得出各種約束條件,每個約束條件要有可解釋性,很有趣,這種模型建出來後,合理性也極高。

值得注意的是,別看我上面覆盤得熱火朝天的,但是我們建模過程中是“舉步維艱”的:因爲我們要一邊建模、一邊出題。 就是這麼誇張,如何運用題目中所給數據,如何假設救援的過程(我們至今也沒有搞清楚無人機實際上是怎麼到達據點的,因爲題目根本沒講),這其中可以供參賽者“自由發揮”的地方實在太多了。以後美賽可能還會延續這種趨勢,因此,同學們可以在參賽中注意:

  • 選題後,果斷對不明確條件大膽假設
  • 把問題抽象爲自己擅長的問題,比如我擅長線性規劃解決路徑問題,我就很果斷地說,無人機規劃可以理解爲一種 VRP 變形問題,然後順着這個思路進行下去。

1.2 模型要簡潔,讓人容易“看得懂”

我學長,建模能力很強(深圳杯冠軍+數競等等成就),現在在清華讀研,竟然在美賽折戟了。不忿之餘,他總結了他經驗,於我很受用:美賽的模型無需多嚴謹、模型不是考慮得越多越好,而是越清晰越好。

他舉了一個例子,他那年我們學校有幾個 F 獎的,結果一問,其中有一組大二的,與學長做的同一道題目。他們只是抓住了一個小角度,忽略了很多條件,建了個“線性規劃”模型而已。他們的成功之處在於,把每條公式的出現原因、想表達什麼都講的很明白。


你問我什麼是線性規劃的話,我下面這個例子解釋一下。

在這裏插入圖片描述

這就是一個線性規劃的節選,還有其他幾條約束式,我沒有截圖出來。線**性規劃的好處在於:很講理,即你的目標很明確(最小化成本或者最大化效益等),條件也很明確。**並且,如果線性規劃可解,求出的一定是最優解。就算規模很大,你依舊可以求出近似最優解。

比如對於上面這個截圖(選自一個車輛路徑規劃的論文),如果我列出了這些式子,緊接着,我可以在文章裏解釋說:

約束(2)表示每個客戶只能分配一個集散地;約束(3)表示j點啓用,才允許其爲客戶提供服務;約束(4)表示某集散地點若啓用,一定要至少覆蓋一個客戶。約束(5)到(8)用於描述TSP基礎模型,分別表示:貨車只在被啓用的集散地間通行;貨車不可以走一個集散地兩次(不可迂迴);對於一個集散地,能且必須被進入一次,並走出一次;對於depot,也是隻能進入/走出一次。


如果你用了一個特別新穎的方法,沒人敢保證評委見過,評委有大概率不認可你個方法。更有可能的情況是,美賽題目這麼靈活,大家解決的問題都是不同的,評委甚至看不懂你說什麼(每天看幾百篇論文,誰能不厭倦呢)。

說白了,美賽不是炫技地方,還是深入淺出、直白明瞭好一些。

還有一點,英語句子別太長太複雜。


1.3 靈敏度分析:提取模型的意義

建模是爲了幹什麼呢?是爲了解決問題。

我們不能奢求模型能夠準確描繪這個問題,美賽也沒要求參賽者能夠在四天時間裏建一個科學性十足的模型。大部分情況下,建模的意義不體現在擬合上,而體現在趨勢的反饋上,即靈敏度分析。

這句話什麼意思呢?我還拿上面的論文爲例。

在這裏插入圖片描述

說白了,就是調整一個給定的參數,比如容納能力:把容納能力5、10、15、20、25的情況下得到的最優值及其他指標算一下,列個圖表出來,然後告訴決策者,容納能力越大越好。這其中,如果能得到反直覺的結論,比如“並非容納能力越大越好,容納能力大到一定程度,不如把這些投資投給別的方面受益大”,效果更好。

我們建的模型,可能很難爲問題提供具體方案,因爲做了太多的假設與簡化;但是,可以通過靈敏度分析來判斷發展趨勢,這也是爲什麼美賽大多要求我們給政府/企業/養龍人寫一份信。信中往往體現這個研究的結果:“在蛋白質和維生素中,您還是多味您的龍一點維生素吧,這樣更好。”而不是:“對於1000公斤的龍,寧每噸喂50公斤豬肉、25公斤白菜就好。”

1.4 快速抽象、學習,而非套用“百寶箱”

實際上,美賽類似一場小型科研:題目來了,先將問題提取出來,再檢索解決過類似問題的方法,套用、改進,最後得出結論。

很多公衆號、知乎答主都介紹一大長篇“經驗”,然後文末“很有良心地”給一個大大的壓縮包,說這裏有各種問題的代碼(有些壓縮包還加密了,需要付費破解)。我的看法是,沒有用。不懂問題算法的人,把問題抽象爲一個經典問題、套用代碼(沒有一對一量身打造的代碼,就算一個動態規劃,也有很多很多變形);懂問題的人,不需要現成的代碼,知道要解決什麼問題後,能利用網絡找到自己所需的資源。

實打實提升算法能力、科研能力,知道建模是怎麼一回事,比給營銷號交智商稅有用多了。

1.5 使用 LaTeX 與 mcmthesis 包排版

請使用 LaTeX 排版。

在這裏插入圖片描述

有了 mcmthesis 包的 LaTeX 就好像一個填空題:你只要按照他給的例子,把摘要、關鍵字、正文的文本填在相應位置就好。

在這裏插入圖片描述

推薦一個網站:Create LaTeX tables online: http://www.tablesgenerator.com/

如果你覺得用代碼寫表格有點費力的話,你可以在這個網站上製作表格,然後生成代碼,再把代碼複製到自己的文章中就好。

LaTeX 怎麼學呢?資源在哪裏呢?我想說,資源太多了。如何安裝、如何使用的教程也太多了。都是免費的。檢索時,注意篩選好的、精簡的教程與資源。 如果你們隊伍連入門 LaTeX 這個問題都無法在5個小時內解決,不好意思,我覺得你們美賽得獎的希望也不大。


2 美賽值得參加嗎

2.1 我們隊伍的人員配置與參賽過程

我們的隊伍是兩男一女,四天下來很累但是很開心。當時是期末考試過後沒幾天就進行美賽了,學校裏的同學都回家了,我們就霸佔一個教室,每天早上七點在食堂集合,晚上十一點左右大家一起走回宿舍,聊聊天。具體的時間安排爲:

日期 上午 下午 晚上
1.25 選題 嘗試C題 放棄C題,決定選擇E題
1.26 早飯時決定選擇B題 開始認真讀B題,發現什麼玩意??? 各種查資料、學模型
1.27 不能再猶豫了,咱們得開始了 問題框架大概想好了,模型有了 真的得開始了
1.28 四個模型大概都成了,吧 別忘了邊建模邊寫作 MEMO/摘要等,通宵自習室訂座位
1.29 排版、捉蟲,熬了個通宵 洗澡睡覺收拾行李 各回各家

比賽中會出現爭論,但大家心是齊的。我們還有一個優勢,就是分工特別明確:有人數理知識紮實、比賽經驗豐富;有人編程、算法、繪圖能力好;有人英語、寫作、表達能力強。

不得不承認美賽注重排版與美觀。最後的排版我們三個人都檢查了好多遍,“捉蟲”即找錯別字、空格的缺失等等。

提交作品時,我們驚歎於:四天時間,我們是怎麼做出這豐滿的21頁的?最後M獎,大家都很欣慰。這次美賽有很多大佬竟然得了DW,被判爲無效,因此我們應該屬於運氣與實力都具備了。

2.2 畫畫都能得O獎,美賽還有公信力嗎(美賽的評獎機制)

近年來,美賽因爲其政治上的不嚴謹性,以及越來越扯的題目,備受批評。每個隊伍都需要交 100 美元報名費與較高的 S 獎得獎率,尤其是美國本土隊伍的參與積極性(2019年中國隊伍:24904,美國隊伍:371)很難不讓人質疑:這不就是騙中國人錢嗎?

對於這個問題,我不做否定回答。

但是——沒有但是。

我身邊有很多高手,建模能力、科研能力我是大寫的服,但美賽卻顆粒無收。我不相信他們在美賽都“碰巧”發揮失誤了。

2019年開獎後,有人在知乎上曬出自己的得獎心得:我們畫了很漂亮的龍素描!得了O獎,很開心!

我沒有讀到他們的論文,不能否認其文章中的模型。但是,評價模型本就難以分出好壞,美賽只有四天時間,一個隊伍把大量時間花費在素描上,難道值得鼓勵嗎?我沒有看到評審方的嚴謹性。

美賽得獎的隊伍,一定有過人之處;但沒得獎的隊伍,真的有可能只是運氣不好而已。以我自己爲例,參加這個比賽,還是比較值得的:四天時間,大家齊心協力、共同咬牙奮鬥,最後收穫了友情與成績,怎麼說都是一段快樂的回憶。

目前國內大部分高校的官方都還是認可美賽的,但實際上,美賽的威信正在減弱(自己作的)。我們隊伍中的三個人都保研成功,現在回頭看來,真正能幫得上保研的,只有很高的專業排名與科研項目(維持很久的項目後者一篇論文)。

2.3 美賽國賽如一場小型科研,但科研本不該如此

最後我還是想吐槽一下這種短期建模比賽,因爲我越來越不明白這是要比什麼。

明明是一個科研問題,卻非要把時間掐得只有三、四天。人家 ACM 等等算法大賽,比的是基礎技能和智商,最後誰程序寫得好誰牛逼,是實打實的硬核比賽,但這種“速成建模比賽”呢?比的是,誰“檢索+建模+寫作+排版”科研一條龍的業務能力強?這是在倡導一種浮躁的論文寫作風氣嗎?

我的閱歷其實也不是很廣,況且現在是深夜,不適合太多吐槽。美賽國賽存在的意義一定是有的。

我希望我的文章能真真正正幫助到各位參賽者(哪怕讓你在比賽中少一點點猶豫),也歡迎各位給我點贊、轉發。

祝各位比賽順利。

參考文獻:
Hong, Jinseok, et al. “Routing for an on-demand logistics service.” Transportation Research Part C: Emerging Technologies 103 (2019): 328-351.

發佈了139 篇原創文章 · 獲贊 48 · 訪問量 2萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章