0 前言
幾種方法對比做該數據集的迴歸分析: github代碼
文件說明:
- LR_global_path.py 全局文件路徑
- readdata.py 讀取數據,簡單的特徵統計顯示
- LR_linreg.py 普通線性迴歸
- Ensembleplot.py 集成迴歸
- fullNet.py 全連接神經網絡
該數據集是收集於聯合循環發電廠的9568個數據點, 共包含5個特徵: 每小時平均環境變量溫度(AT),環境壓力(AP),相對溼度(RH),排氣真空(V)和淨每小時電能輸出(PE), 其中電能輸出PE是我們要預測的變量。
數據:介紹地址 下載地址
普通的迴歸:
- 線性迴歸(LinearRegression)
- 嶺迴歸(RidgeCV、Ridge)
- 支持向量機線性迴歸(svm.SVR(kernel=‘linear’))
集成迴歸學習方法:
- 隨機森林迴歸(RandomForestRegressor)
- 極端樹迴歸(ExtraTreesRegressor)
- 梯度提升迴歸(GradientBoostingRegressor)
全連接神經網絡
簡單線性迴歸:
集成迴歸:
全連接神經網絡:
tensorboard 可以進一步展示數據流動方向和節點情況: