實訓小結(6)

**

3.18 模型評估參數 地理位置轉換

**
np.linspace(0.0, 1.0, num=30)
linspace函數可以生成元素從0到1等間隔的數量爲爲30個的一個list

通過繪製學習曲線圖來判斷模型的狀態:過擬合還是欠擬合
1、訓練和驗證都低於準確率,說明模型欠擬合,
要增加模型的複雜度,比如,增加特徵、增加樹的深度、減小正則項等等,此時再增加數據量是不起作用的。

2、訓練的模型符合我們需要的準確率,但是驗證模型要低於準確率,說明模型過擬合(訓練的很好,但是預測的準確率不好)
增大分裂節點樣本數、增大樣本數、減少特徵數等等。

RMSE MAE 與標準差的對比
https://blog.csdn.net/capecape/article/details/78623897
RMSE與MAE對比:RMSE相當於L2範數,MAE相當於L1範數。次數越高,計算結果就越與較大的值有關,而忽略較小的值,所以這就是爲什麼RMSE針對異常值更敏感的原因(即有一個預測值與真實值相差很大,那麼RMSE就會很大)。

python調用百度地圖API實現經緯度換算
作者:博觀厚積
鏈接:https://www.jianshu.com/p/773ff5f08a2c/

一、初始化數據:csv格式的數據表格

二、註冊百度地圖api,獲取免費的密鑰,http://lbsyun.baidu.com/
首頁點擊申請密鑰按鈕,經過填寫個人信息、郵箱註冊等,成功之後在開放平臺上點擊“創建應用”,填寫相關信息,在這裏特別說明的是,在IP白名單框裏,如果不清楚自己的IP地址,最好設置爲:0.0.0.0/0,
雖然百度提醒它會有泄露使用的風險,但是有時候你把你自己的IP地址輸進去可能也不行。提交後,在你創建應用的訪問應用(AK)那一欄就是你的密鑰。

三、構造經緯度獲取函數

四、寫入文件中
具體詳情見代碼

在Pycharm中創建項目時,注意文件夾的名稱不要和你要導入的某個包名的名稱相同,否則會發生導入模塊找不到的錯誤

**

3.19 雜記

**
讀取數據,描述數據
對數據類型進行轉換
train_df[[‘floors’, ‘houseStruct’,‘decoration’,‘isElevator’]] = train_df[[‘floors’, ‘houseStruct’,‘decoration’,‘isElevator’]].convert_objects(convert_numeric=True)
.astype(float)進行強制轉換

待做:
晚上回去安裝 conda update scikit-learn

Python庫的使用

機器學習
對具有時間序列的模型處理時,在分割數據的時候必須要考慮到時間

**

3.20 雜記

**
基於時間序列的模型在短時間內比較難搞,現考慮拆分時間

數據集重新彙總:
選取全國數據的2018年2019年的數據

今日遇到問題:
百度地圖ak有限額配置,進行開發者認證
pandas.dataframe怎麼把列變成索引,通過set_index來處理,df2 = df1.set_index(‘name’)

學習Python股票預測

數據預處理
缺失值的查找,用pandas查找

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章