作者:mingo_敏
編輯:深度學習自然語言處理
鏈接:
https://blog.csdn.net/shanglianlm/article/details/85019768
tensorflow和pytorch很多都是相似的,這裏以pytorch爲例。
19種損失函數
1. L1範數損失 L1Loss
計算 output 和 target 之差的絕對值。
torch.nn.L1Loss(reduction='mean')
參數:
reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。
2 均方誤差損失 MSELoss
計算 output 和 target 之差的均方差。
torch.nn.MSELoss(reduction='mean')
參數:
reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。
3 交叉熵損失 CrossEntropyLoss
當訓練有 C 個類別的分類問題時很有效. 可選參數 weight 必須是一個1維 Tensor, 權重將被分配給各個類別. 對於不平衡的訓練集非常有效。
在多分類任務中,經常採用 softmax 激活函數+交叉熵損失函數,因爲交叉熵描述了兩個概率分佈的差異,然而神經網絡輸出的是向量,並不是概率分佈的形式。所以需要 softmax激活函數將一個向量進行“歸一化”成概率分佈的形式,再採用交叉熵損失函數計算 loss。
torch.nn.CrossEntropyLoss(weight=None,ignore_index=-100, reduction='mean')
參數:
weight (Tensor, optional) – 自定義的每個類別的權重. 必須是一個長度爲 C 的 Tensor
ignore_index (int, optional) – 設置一個目標值, 該目標值會被忽略, 從而不會影響到 輸入的梯度。
reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。
4 KL 散度損失 KLDivLoss
計算 input 和 target 之間的 KL 散度。KL 散度可用於衡量不同的連續分佈之間的距離, 在連續的輸出分佈的空間上(離散採樣)上進行直接回歸時 很有效.
torch.nn.KLDivLoss(reduction='mean')
參數:
reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。
5 二進制交叉熵損失 BCELoss
二分類任務時的交叉熵計算函數。用於測量重構的誤差, 例如自動編碼機. 注意目標的值 t[i] 的範圍爲0到1之間.
torch.nn.BCELoss(weight=None, reduction='mean')
參數:
weight (Tensor, optional) – 自定義的每個 batch 元素的 loss 的權重. 必須是一個長度爲 “nbatch” 的 的 Tensor
6 BCEWithLogitsLoss
BCEWithLogitsLoss損失函數把 Sigmoid 層集成到了 BCELoss 類中. 該版比用一個簡單的 Sigmoid 層和 BCELoss 在數值上更穩定, 因爲把這兩個操作合併爲一個層之後, 可以利用 log-sum-exp 的 技巧來實現數值穩定.
torch.nn.BCEWithLogitsLoss(weight=None, reduction='mean', pos_weight=None)
參數:
weight (Tensor, optional) – 自定義的每個 batch 元素的 loss 的權重. 必須是一個長度 爲 “nbatch” 的 Tensor
7 MarginRankingLoss
torch.nn.MarginRankingLoss(margin=0.0, reduction='mean')
對於 mini-batch(小批量) 中每個實例的損失函數如下:
參數:
margin:默認值0
8 HingeEmbeddingLoss
torch.nn.HingeEmbeddingLoss(margin=1.0, reduction='mean')
對於 mini-batch(小批量) 中每個實例的損失函數如下:
參數:
margin:默認值1
9 多標籤分類損失 MultiLabelMarginLoss
torch.nn.MultiLabelMarginLoss(reduction='mean')
對於mini-batch(小批量) 中的每個樣本按如下公式計算損失:
10 平滑版L1損失 SmoothL1Loss
也被稱爲 Huber 損失函數。
torch.nn.SmoothL1Loss(reduction='mean')
其中
11 2分類的logistic損失 SoftMarginLoss
torch.nn.SoftMarginLoss(reduction='mean')
12 多標籤 one-versus-all 損失 MultiLabelSoftMarginLoss
torch.nn.MultiLabelSoftMarginLoss(weight=None, reduction='mean')
13 cosine 損失 CosineEmbeddingLoss
torch.nn.CosineEmbeddingLoss(margin=0.0, reduction='mean')
參數:
margin:默認值0
14 多類別分類的hinge損失 MultiMarginLoss
torch.nn.MultiMarginLoss(p=1, margin=1.0, weight=None, reduction='mean')
參數:
p=1或者2 默認值:1
margin:默認值1
15 三元組損失 TripletMarginLoss
和孿生網絡相似,具體例子:給一個A,然後再給B、C,看看B、C誰和A更像。
torch.nn.TripletMarginLoss(margin=1.0, p=2.0, eps=1e-06, swap=False, reduction='mean')
其中:
16 連接時序分類損失 CTCLoss
CTC連接時序分類損失,可以對沒有對齊的數據進行自動對齊,主要用在沒有事先對齊的序列化數據訓練上。比如語音識別、ocr識別等等。
torch.nn.CTCLoss(blank=0, reduction='mean')
參數:
reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。
17 負對數似然損失 NLLLoss
負對數似然損失. 用於訓練 C 個類別的分類問題.
torch.nn.NLLLoss(weight=None, ignore_index=-100, reduction='mean')
參數:
weight (Tensor, optional) – 自定義的每個類別的權重. 必須是一個長度爲 C 的 Tensor
ignore_index (int, optional) – 設置一個目標值, 該目標值會被忽略, 從而不會影響到 輸入的梯度.
18 NLLLoss2d
對於圖片輸入的負對數似然損失. 它計算每個像素的負對數似然損失.
torch.nn.NLLLoss2d(weight=None, ignore_index=-100, reduction='mean')
參數:
weight (Tensor, optional) – 自定義的每個類別的權重. 必須是一個長度爲 C 的 Tensor
reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。
19 PoissonNLLLoss
目標值爲泊松分佈的負對數似然損失
torch.nn.PoissonNLLLoss(log_input=True, full=False, eps=1e-08, reduction='mean')
參數:
log_input (bool, optional) – 如果設置爲 True , loss 將會按照公 式 exp(input) - target * input 來計算, 如果設置爲 False , loss 將會按照 input - target * log(input+eps) 計算.
full (bool, optional) – 是否計算全部的 loss, i. e. 加上 Stirling 近似項 target * log(target) - target + 0.5 * log(2 * pi * target).
eps (float, optional) – 默認值: 1e-8