最全的損失函數彙總

作者:mingo_敏

編輯:深度學習自然語言處理

鏈接:

https://blog.csdn.net/shanglianlm/article/details/85019768

tensorflow和pytorch很多都是相似的,這裏以pytorch爲例。

19種損失函數

1. L1範數損失 L1Loss

計算 output 和 target 之差的絕對值。

torch.nn.L1Loss(reduction='mean')

參數:

reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。

2 均方誤差損失 MSELoss

計算 output 和 target 之差的均方差。

torch.nn.MSELoss(reduction='mean')

參數:

reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。

3 交叉熵損失 CrossEntropyLoss

當訓練有 C 個類別的分類問題時很有效. 可選參數 weight 必須是一個1維 Tensor, 權重將被分配給各個類別. 對於不平衡的訓練集非常有效。

在多分類任務中,經常採用 softmax 激活函數+交叉熵損失函數,因爲交叉熵描述了兩個概率分佈的差異,然而神經網絡輸出的是向量,並不是概率分佈的形式。所以需要 softmax激活函數將一個向量進行“歸一化”成概率分佈的形式,再採用交叉熵損失函數計算 loss。

torch.nn.CrossEntropyLoss(weight=None,ignore_index=-100, reduction='mean')

參數:

weight (Tensor, optional) – 自定義的每個類別的權重. 必須是一個長度爲 C 的 Tensor

ignore_index (int, optional) – 設置一個目標值, 該目標值會被忽略, 從而不會影響到 輸入的梯度。

reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。

4 KL 散度損失 KLDivLoss

計算 input 和 target 之間的 KL 散度。KL 散度可用於衡量不同的連續分佈之間的距離, 在連續的輸出分佈的空間上(離散採樣)上進行直接回歸時 很有效.

torch.nn.KLDivLoss(reduction='mean')

參數:

reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。

5 二進制交叉熵損失 BCELoss

二分類任務時的交叉熵計算函數。用於測量重構的誤差, 例如自動編碼機. 注意目標的值 t[i] 的範圍爲0到1之間.

torch.nn.BCELoss(weight=None, reduction='mean')

參數:

weight (Tensor, optional) – 自定義的每個 batch 元素的 loss 的權重. 必須是一個長度爲 “nbatch” 的 的 Tensor

6 BCEWithLogitsLoss

BCEWithLogitsLoss損失函數把 Sigmoid 層集成到了 BCELoss 類中. 該版比用一個簡單的 Sigmoid 層和 BCELoss 在數值上更穩定, 因爲把這兩個操作合併爲一個層之後, 可以利用 log-sum-exp 的 技巧來實現數值穩定.

torch.nn.BCEWithLogitsLoss(weight=None, reduction='mean', pos_weight=None)

參數:

weight (Tensor, optional) – 自定義的每個 batch 元素的 loss 的權重. 必須是一個長度 爲 “nbatch” 的 Tensor

7 MarginRankingLoss

torch.nn.MarginRankingLoss(margin=0.0, reduction='mean')

對於 mini-batch(小批量) 中每個實例的損失函數如下:

參數:

margin:默認值0


8 HingeEmbeddingLoss

torch.nn.HingeEmbeddingLoss(margin=1.0,  reduction='mean')

對於 mini-batch(小批量) 中每個實例的損失函數如下:

參數:

margin:默認值1

9 多標籤分類損失 MultiLabelMarginLoss

torch.nn.MultiLabelMarginLoss(reduction='mean')

對於mini-batch(小批量) 中的每個樣本按如下公式計算損失:

10 平滑版L1損失 SmoothL1Loss

也被稱爲 Huber 損失函數。

torch.nn.SmoothL1Loss(reduction='mean')


其中

11 2分類的logistic損失 SoftMarginLoss

torch.nn.SoftMarginLoss(reduction='mean')



12 多標籤 one-versus-all 損失 MultiLabelSoftMarginLoss

torch.nn.MultiLabelSoftMarginLoss(weight=None, reduction='mean')


13 cosine 損失 CosineEmbeddingLoss

torch.nn.CosineEmbeddingLoss(margin=0.0, reduction='mean')


參數:

margin:默認值0

14 多類別分類的hinge損失 MultiMarginLoss

torch.nn.MultiMarginLoss(p=1, margin=1.0, weight=None,  reduction='mean')


參數:

p=1或者2 默認值:1
margin:默認值1

15 三元組損失 TripletMarginLoss

和孿生網絡相似,具體例子:給一個A,然後再給B、C,看看B、C誰和A更像。

torch.nn.TripletMarginLoss(margin=1.0, p=2.0, eps=1e-06, swap=False, reduction='mean')


其中:

16 連接時序分類損失 CTCLoss

CTC連接時序分類損失,可以對沒有對齊的數據進行自動對齊,主要用在沒有事先對齊的序列化數據訓練上。比如語音識別、ocr識別等等。

torch.nn.CTCLoss(blank=0, reduction='mean')

參數:

reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。

17 負對數似然損失 NLLLoss

負對數似然損失. 用於訓練 C 個類別的分類問題.

torch.nn.NLLLoss(weight=None, ignore_index=-100,  reduction='mean')

參數:

weight (Tensor, optional) – 自定義的每個類別的權重. 必須是一個長度爲 C 的 Tensor

ignore_index (int, optional) – 設置一個目標值, 該目標值會被忽略, 從而不會影響到 輸入的梯度.

18 NLLLoss2d

對於圖片輸入的負對數似然損失. 它計算每個像素的負對數似然損失.

torch.nn.NLLLoss2d(weight=None, ignore_index=-100, reduction='mean')

參數:

weight (Tensor, optional) – 自定義的每個類別的權重. 必須是一個長度爲 C 的 Tensor

reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。

19 PoissonNLLLoss

目標值爲泊松分佈的負對數似然損失

torch.nn.PoissonNLLLoss(log_input=True, full=False,  eps=1e-08,  reduction='mean')

參數:

log_input (bool, optional) – 如果設置爲 True , loss 將會按照公 式 exp(input) - target * input 來計算, 如果設置爲 False , loss 將會按照 input - target * log(input+eps) 計算.

full (bool, optional) – 是否計算全部的 loss, i. e. 加上 Stirling 近似項 target * log(target) - target + 0.5 * log(2 * pi * target).

eps (float, optional) – 默認值: 1e-8

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章