2020美賽數學建模 校級培訓——Week_1

引言:

博主在今年寒假參加了學校組織的美國大學生數學建模競賽培訓, 在此,用博客來記錄這段培訓時光。

本篇博客將記錄第一輪培訓(1.4——1.8 )的相關培訓內容:
第一週安排

Day 1: 2020.1.4

一、SPSS軟件與統計基礎

常見的統計數據工具:SPSS
SPSS

  • 統計中重要操作:

1.描述統計
2.迴歸
3.分類
4.降維

  • SPSS的基本操作:
  1. SPSS對數據的基本處理
  2. 相關性分析
  3. 普通迴歸分析
  4. 一般線性模型
  5. 廣義線性模型
  6. 聚類分析(無監督學習)
  7. 判別分析(有監督學習)

二、優秀美賽論文學習

Problem:2016MCM_C

2016MCM_C: M獎

Day 2: 2020.1.5

一、2019年數模國賽C題優秀論文講解(一)

對這篇優秀論文逐頁逐頁講解,講得很詳細,
這裏就只放一張摘要感受一下:

在這裏插入圖片描述

Day 3: 2020.1.6

一、第一輪模擬題:2019MCM_C

1. Problem:

2019年MCM問題C:類阿片危機
背景:美國正在經歷一場關於使用合成和非合成類阿片治療和管理疼痛(合法、處方使用)或娛樂目的(非法、非處方使用)的國家危機。像疾病控制中心(CDC)這樣的聯邦組織正在努力“拯救生命並防止這種流行病對健康的負面影響,如阿片類藥物使用障礙、肝炎和艾滋病毒感染,“1強制執行現有法律對聯邦調查局(FBI)和美國藥品監督管理局(DEA)等都是一項複雜的挑戰。
對美國經濟的重要部門也有影響。例如,如果阿片類藥物危機蔓延到美國人口的各個階層(包括受過大學教育和擁有高級學位的人羣),需要精密勞動技能、高技術組件組裝的企業,與客戶和客戶之間敏感的信任或安全關係可能難以填補這些職位。此外,如果老年人中阿片類藥物成癮的比例增加,醫療保健費用和輔助生活設施人員配置也將受到影響。
緝毒局/國家法醫實驗室信息系統(NFLIS)作爲緝毒局(DEA)轉移管制辦公室的一部分,發佈了一份數據密集型年度報告,內容涉及“聯邦、州分析的毒品案件的毒品鑑定結果和相關信息,NFLIS內的數據庫包括來自犯罪實驗室的數據,這些實驗室處理了全國每年約120萬個州和地方毒品案件的88%以上。對於這個問題,我們關注位於美國五(5)個州的各個縣:俄亥俄州、肯塔基州、西弗吉尼亞州、弗吉尼亞州和田納西州。在美國,一個縣是每個州下一個擁有稅務機關的下級政府。
隨此問題描述提供了幾個數據集供您使用。第一個文件(MCM_NFLIS_Data.xlsx)包含了這五個州的每個縣2010-2017年麻醉性鎮痛藥(合成類阿片)和海洛因的毒品鑑定計數,每個州的犯罪實驗室都向DEA報告了這些數據。當執法機構將證據作爲刑事調查的一部分提交給犯罪實驗室,實驗室的法醫科學家對證據進行檢驗時,就會進行毒品鑑定。通常,執法機構在提交這些樣本時,會在事件報告中提供位置數據(縣)。當證據提交給犯罪實驗室而未提供此位置數據時,犯罪實驗室使用提交案件的市/縣/州調查執法機構的位置。就這個問題而言,您可以假設縣位置數據是正確的。
另外七(7)個文件是壓縮文件夾,其中包含美國人口普查局的摘錄,這些摘錄代表了2010-2016年間爲這五個州的縣收集的一組共同的社會經濟因素(ACS-xx-U
5YR-DP02.zip)。(注:2017年沒有相同的數據。)
代碼表與定義每個變量的每個數據集一起出現。雖然您可以使用其他資源進行研究和背景信息,但所提供的數據集包含您應該用於此問題的唯一數據。
1疾病控制中心網站(https://www.cdc.gov/features/accounting-opiods/index.html),2018年9月4日訪問。
第2頁共3頁 問題:
第一部分。利用所提供的NFLIS數據,建立一個數學模型,描述報告的合成類阿片和海洛因事件(案例)在五個州及其縣之間隨時間的傳播和特點。使用您的模型,確定五個州中每個州可能開始使用特定阿片類藥物的任何可能位置。
如果你的團隊所確定的模式和特點繼續下去,美國政府是否應該有什麼特別的擔憂?在什麼樣的藥物識別閾值水平上會發生這些情況?你的模型預測它們將在何時何地發生?
第二部分。利用提供的美國人口普查社會經濟數據,解決以下問題:
關於阿片類藥物的使用如何達到目前的水平,誰在使用/濫用阿片類藥物,是什麼導致阿片類藥物使用和成癮的增長,以及爲什麼阿片類藥物的使用盡管存在已知的危險,但仍然持續存在,有很多相互矛盾的假設作爲解釋。使用或使用趨勢是否與提供的美國人口普查社會經濟數據有關?如果是,請修改第1部分中的模型,以包含此數據集中的任何重要因素。
第三部分。最後,結合第1部分和第2部分的結果,找出應對阿片類藥物危機的可能策略。使用您的模型測試此策略的有效性;確定成功(或失敗)所依賴的任何重要參數界限。
除了你的主要報告,還包括一份1-2頁的備忘錄給首席行政官,DEA/NFLIS數據庫,總結你在建模過程中發現的任何重要見解或結果。
你的提交應該包括:一頁彙總表,一頁到兩頁的備忘錄,你的解決方案不超過20頁,最多23頁,你的摘要和備忘錄。注意:參考列表和任何附錄不計入23頁的限制,應在完成解決方案後出現。

2、題目解讀

  • 任務一:判斷社會經濟學數據與毒品的相關性。

這個任務比較簡單,做個PCA和相關性矩陣就好了。

  • 任務二:添加社會經濟學數據,改進C.1的模型

必然需要的數據:與人口、經濟水平相關的數據 可能需要的數據:自己新構造的指標,指標實在太多了(近600個),必然需要特徵融合
(1)把所有的數量指標都考慮進經濟學因素,比如計算人均毒品案件數量
(2)把經濟學指標添加進迴歸模型/決策樹的自變量
(3)設置迴歸模型懲罰項,避免過擬合(雖然這點數據很難過擬合,一般都收斂不了,等待打臉)
(4)如果你使用了AutoML,Auto_Keras,EasyDL之類的自動迴歸機器當我什麼也沒說,丟進變量訓練就是了
(5)注意對比模型效果,理論上應該有巨大提升,如果沒有就操作一下

  • 任務三:解釋模型

這道題到底要你做什麼? 可能改進模型並不是最重要的,而是前面的"computing model to explain"。
你也需要給出你的因素與毒品變化趨勢之間的解釋,並且應當具體到最重要的幾個或十幾個變量上。
這樣的解釋更可能不需要數值上的解釋,而是結合經濟學模型以及社會因素的解釋,
畢竟數值上的解釋無異於解決問題,而C題的第二個核心在於“如何給出相應的抑制性政策”。

Day 4: 2020.1.7

第一輪模擬題:2019MCM_C

1、論文模板

因爲第一次寫美賽論文,完全沒有經驗,所以第一次基本屬於摸瞎,
甚至連摘要頁的基本格式都沒有搞懂,ε=(´ο`*)))
在這裏插入圖片描述

2、論文目錄

在這裏插入圖片描述

Day 5: 2020.1.8

第一輪模擬題:2019MCM_C

1、論文修改稿

在這裏插入圖片描述
在這裏插入圖片描述

2、論文終稿

2019MCM_C:論文終稿(附件附帶下載)

結語

至此,第一週培訓結束,我們也順利完成了第一篇論文, 雖然是第一次寫美賽論文很多論文格式,排版,要求都不是很熟悉,但最後好在勉強完成了論文。
相信有過第一次練習後,以後的論文會寫得更好!

注:第一輪模擬題的論文會放在附件裏,有需要的小夥伴可以下載~
鏈接:第一輪:2019MCM_C.pdf

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章