一.異常數據處理
1.拉以達準則(基於3-σ準則)
拉依達準則是指先假設一組檢測數據只含有隨機誤差,對其進行計算處理得到標準偏差,按一定概率確定一個區間,認爲凡超過這個區間的誤差,就不屬於隨機誤差而是粗大誤差,含有該誤差的數據應予以剔除。
這種判別處理原理及方法僅侷限於對正態或近似正態分佈的樣本數據處理,它是以測量次數充分大爲前提(樣本>10),當測量次數少的情形用準則剔除粗大誤差是不夠可靠的。
參考博文:https://blog.csdn.net/ChenVast/article/details/82790633
https://blog.csdn.net/pandacsu/article/details/71159463
二.數據離散化
數據離散化是指將連續的數據進行分段,使其變爲一段段離散化的區間。分段的原則有基於等距離、等頻率或優化的方法。具體可以參照下面這篇博文:數據預處理之數據離散化
三.數據標準化(無量綱化)
1.極差法
參考博文:https://blog.csdn.net/qq_32925031/article/details/88562141
四.指標權重
1.主成分分析法:https://www.cnblogs.com/zhhda/p/4535476.html
2.層次分析法
3.嫡權法:https://blog.csdn.net/mycafe_/article/details/79285762
4.灰色關聯度矩陣:https://blog.csdn.net/richeylee/article/details/52495787#comments
五.聚類分析
常見的六大聚類算法:https://blog.csdn.net/Katherine_hsr/article/details/79382249
六.優化算法
優化問題是數模中常見的問題,在這個問題中最重要的是找到目標表達式和約束條件。
1.lingo:使用lingo是一種較爲簡單的求解方式。
2.循環遍歷的變步長枚舉法
七.模型預測
建立仿真模型,根據給出數據預測模型結果。
八.數據擬合
最簡單的是通過matlab工具箱進行擬合。
https://jingyan.baidu.com/article/1876c8525dfa21890a137640.html
九.時間序列
時間序列是一種關於預測的方法,這種預測是跟時間相關的。
參考博文:https://blog.csdn.net/qq_40006058/article/details/80191168
十.模型檢驗
1.穩定性分析(又叫魯棒性分析)
改變模型參數,看模型結果的變化,固定輸入看輸出,看模型的情況。
2.靈敏度分析
在值不變的條件下,某個約束條件的變化範圍有多大,固定輸出看輸入,看模型適用的條件。
3.精度分析
思想:
1.可以用一部分數據進行擬合,用另一部分數據進行檢驗。