XGBoost的以mae作爲優化目標探究

原創

weijian001

2020-06-22 08:52

1 mae/mad和mse介紹

Mse：mean-square error。

可導，常常作爲loss function。

M S E (y, y ˆ) = 1 n s a m p l e s \sum i = 0 n s a m p l e s - 1 (y - y ˆ) 2

Mae：mean absolute error

不可導。

M A E (y, y ˆ) = 1 n s a m p l e s \sum i = 0 n s a m p l e s - 1 ∣ ∣ (y - y ˆ) ∣ ∣

2 如何在XGBoost中近似mae

我們都知道XGBoost支持我們自定義目標函數，但是其在實現中對目標函數做了二階泰勒展開，所以我們需要提供目標函數的一階和二階導數。但是MAE並不是連續可導的（在0處不可導），無法直接作爲XGBoost的目標函數。所以目前比較好的方法是找到一個函數來近似它。

2.1 Huber loss

在統計學當中，huber loss是魯棒迴歸（robust regression）的損失函數，相比於平方損失更不容易受異常點的影響。有一些分類任務有時也會使用。 —Wikipedia

L δ = {1 2 a 2 δ (| a | - 1 2 δ) f o r | a | \leq δ o t h e r w i s e

這個函數對a 比較小的值是二次的，對比較大的值是線型的。a 常常代表殘差，a=y−f(x) 。

L δ = {1 2 (y - f (x)) 2 δ (∣ ∣ y - f (x)) ∣ ∣ - 1 2 δ) f o r ∣ ∣ y - f (x) ∣ ∣ \leq δ o t h e r w i s e

在XGBoost的python可以如下實現：

def huber_approx_obj(preds, dtrain):
    d = dtrain.get_labels() - preds #remove .get_labels() for sklearn
    h = 1  #h is delta
    scale = 1 + (d / h) ** 2
    scale_sqrt = np.sqrt(scale)
    grad = d / scale_sqrt
    hess = 1 / scale / scale_sqrt
    return grad, hess

2.2 Fair loss

L c = c | x | - c l n (∣ ∣ | x | + c ∣ ∣)

在XGBoost的python實現如下：

def fair_obj(preds, dtrain):
    """y = c * abs(x) - c * np.log(abs(abs(x) + c))"""
    x = dtrain.get_labels() - preds
    c = 1
    den = abs(x) + c
    grad = c*x / den
    hess = c*c / den ** 2
    return grad, hess

2.3 Log-Cosh loss

L = l n (c o s h (x))

在XGBoost中的python實現如下：

def log_cosh_obj(preds, dtrain):
    x = dtrain.get_labels() - preds
    grad = np.tanh(x)
    hess = 1 / np.cosh(x)**2
    return grad, hess

2.4 對比

動態圖對比了mae,mse,fairloss,log−coshloss 在圖像上的差異。可以看到mse 圖像與mae 在x值較大時差別較大，log−cosh 在一部分區域內與mse 類似，但是在之後會出現斷崖式地改變，只有fairloss 一直與mae 圖像吻合，huberloss 因爲分段函數的問題暫時沒有體現在圖像上。

3 理論分析

@ To do

4 References

1.Xgboost-How to use “mae” as objective function?

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

XGBoost的以mae作爲優化目標探究

1 mae/mad和mse介紹

2 如何在XGBoost中近似mae

2.1 Huber loss

2.2 Fair loss

2.3 Log-Cosh loss

2.4 對比

3 理論分析

4 References

記一次 .NET某工業設計軟件崩潰分析

創建 Vue3 項目

TS + Webpack 整合 Jest

分享5款.NET開源免費的Redis客戶端組件庫

安卓手機如何登錄抖音境外版

golang開發 gorilla websocket的使用

面試官：如果不允許線程池丟棄任務，應該選擇哪個拒絕策略？

嵌入式汽車電子學習路線

Mac卸載 Node npm，升級 Node

uni.showModel內容換行

Hive 實現將時間（時間戳）歸到某時間片

Linux下爲sudo命令定義PATH環境變量

Jupyter Notebook遠程登錄及自定義配置

緩解pandas中DataFrame佔用內存過大的問題

Hive中行拆分操作

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結