三元組損失“Deep Metric Learning via Lifted Structured Feature Embedding”

原創

2019-01-22 13:54

http://www.cnblogs.com/wangxiaocvpr/p/5921074.html

caffe實現解釋：https://blog.csdn.net/zziahgf/article/details/78568696

tensorflow實現：http://10.1.2.209/lianjie/install-packages/blob/master/metric_loss_ops.py#L410

caffe實現：https://github.com/rksltnl/Deep-Metric-Learning-CVPR16/

將mini-batch中樣本對距離向量（O(m) ）提升到距離矩陣（O(m2) ），並基於此定義了一個新的結構化損失函數。

對比損失及triplet loss迴歸

略。

方法描述

使用訓練集中的所有正樣本對及負樣本對定義結構化損失函數：

J=12Pi,j∈Pmax0,Ji,j2

Ji,j=maxmaxi,k∈Nα-Di,k,maxj,l∈Nα-Dj,l+Di,j

其中P 是所有的正樣本對，N 是所有的負樣本對，這個函數有兩個計算難點：（1）它是非平滑的，（2）計算梯度需要挖掘所有的樣本對好幾次。

使用兩種方式解決上述問題：首先在函數上優化一個平滑的上邊界，其次，對於大數據常用的方法類似，我們採用隨機的方法（隨機採樣一部分正樣本對），在選擇困難樣本對，使用mini-batch中所有樣本的信息。

圖2a，2b顯示了batch_size = 6的對比和三元損失嵌入空間，增加額外的頂點比增加額外的邊計算量大的多，增加頂點帶來了額外的I/O、存儲。

爲使用batch的全部信息，使用batch中所有的樣本對，即從O(m) 到Om2 ，圖2c展示了將樣本對轉化成全連接的緻密的矩陣距離。加入某batch具有c維特徵X∈Rm×c ，batch所有特徵平方範數組成的列向量爲x=f(x1)22,…,f(xm)22T ，平方距離矩陣可以使用下式計算：

D2=x1T+1xT-2XXT

其中

Dij2=fxi-f(xj)22

隨機樣本對產生的負邊含有的信息非常少，它們基本是easy樣本，加入了採樣策略，隨機採樣一小部分正樣本對，然後增加困難的負樣本。圖3顯示了一個正樣本對困難負樣本的挖掘過程，對於正樣本對的每個樣本，尋找困難負樣本，這與triplet損失中只對anchor找負樣本不同。這個過程可以使用平方距離矩陣D2 快速實現。

由於採用嵌套的max 函數來尋找單個 hardest negative 往往導致網絡收斂到一個 bad 局部最優解，使用平滑上邊界優化，每個batch的損失函數定義爲：

Ji,j=logi,k∈Nexp⁡{α-Di,k}+j,l∈Nexp⁡{α-Dj,l}+Di,j

J=12Pi,j∈Pmax0,Ji,j2

梯度後向傳播的算法爲：

損失函數對於距離的梯度爲：

∂J∂Di,j=1PJi,j1Ji,j>0

∂J∂Di,k=1PJi,j1Ji,j>0-exp⁡{α-Di,k}exp⁡{Ji,j-Di,j}

∂J∂Dj,l=1PJi,j1Ji,j>0-exp⁡{α-Dj,l}exp⁡{Ji,j-Di,j}

圖4介紹了對比損失和triplet損失可能失敗的幾種情況，對於對比嵌入（圖4a），當隨機挑選的負樣本與另外一類的某樣本共線時，失敗；對於triplet嵌入（圖4b），當採樣的負樣本在採樣的正樣本和anchor的margin邊界內時失敗；這是對比損失和三元損失均將正樣本xi推向了第三類。在提出的嵌入空間中（4c），給出了足夠多的隨機樣本，在margin邊界內的困難負樣本xk將正樣本xi推向了正確的方向。

實驗結果

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

網易面試：SpringBoot如何開啓虛擬線程？

虛擬線程（Virtual Thread）也稱協程或纖程，是一種輕量級的線程實現，與傳統的線程以及操作系統級別的線程（也稱爲平臺線程）相比，它的創建開銷更小、資源利用率更高，是 Java 併發編程領域的一項重要創新。 PS：虛擬線程正式發佈

Java中文社羣

2024-06-12 14:42:21

聊聊GLM-4-9B開源模型的微調loss計算

概述 Github官方地址：GLM-4 網上已經有很多關於微調的文章，介紹各種方式下的使用，這裏不會贅述。我個人比較關心的是微調時的loss計算邏輯，這點在很多的文章都不會有相關的描述，因爲大多數人都是關心如何使用之類的應用層，而不是其具體

2024-06-12 14:42:01

在.NET Core，除了VB的LikeString，還有其它方法嗎？(四種LikeString實現分享)

Like運算符很好用，特別是它所提供的其中*、?這兩種通配符，在Windows文件系統和各類項目中運用非常廣泛。但Like運算符僅在VB中支持，在C#中，如何實現呢？以下是關於LikeString的四種實現方式，其中第四種爲Regex正

2024-06-12 14:40:00

解讀surging 的內存過高的原因

前言對於.NET開發人員來講，一個程序佔用內存過高，是極其糟糕，是一款不合格的程序軟件，.NET開發人員也不會去使用服務器垃圾收集器(ServerGarbageCollection),而是選用工作站垃圾收集器，而是對於一款低

2024-06-12 14:38:40

【接口自動化測試框架練習】springboot+react+mysql～極簡版postman

可以說是一個toy program，chatgpt完成了一部分工作，我也完成了一部分工作，我倆合作的，我佔百分之80%，他百分之20%，哈哈沒他不行，源碼奉上。https://github.com/Jinwenxin/test-api-fr

金大鑫要堅持

2024-06-12 14:36:30

sm4加密工具類

using Org.BouncyCastle.Utilities.Encoders; using System; using System.Collections.Generic; using System.Linq; using Syst

2024-06-12 14:34:40

下載遊戲的好網站

https://www.gbtgames.com/thread-1198.htm 都是安裝包, 扔迅雷裏面就行. 都很乾淨沒廣告.

張博的博客

2024-06-12 14:29:19

記一次 .NET某遊戲幣自助機後端內存暴漲分析

一：背景 1. 講故事前些天有位朋友找到我，說他們的程序內存會偶發性暴漲，自己分析了下是非託管內存問題，讓我幫忙看下怎麼回事？哈哈，看到這個dump我還是非常有興趣的，居然還有這種遊戲幣自助機類型的程序，下次去大玩家看看他們出幣的機器後端

2024-06-12 14:25:09

CSS 遮罩層

html <!DOCTYPE html> <html> <head> <link rel="stylesheet" href="basic.css"> </head> <body> <div class="masked-element">

2024-06-12 14:24:39

sc-token傳參方式

2024-06-12 14:24:29

Excel甘特

1、數據 2、全選日期(從8到22的所有日期) 3、爲全選日期新增規則規則1(當前日期>=開始日期，當前日期<=結束日期) 公式裏面$符號去掉格式如下格式化如下點確定如下規則2(超過當前日期)

2024-06-12 14:24:29

限速上傳文件到騰訊對象存儲cos的腳本

官網：https://cloud.tencent.com/document/product/436/12269 安裝包，這裏用的python2.7 # pip install -U cos-python-sdk-v5 -i http

2024-06-12 14:23:19

Mysql無主鍵刪除重複數據的快速方法

create procedure p() begin create table casbin_rule_copy2 select distinct * from casbin_rule; drop table casbi

2024-06-12 14:22:49

HDU 1255（掃描線、線段樹區間修改）

Problem - 1255 (hdu.edu.cn) 題意在二維平面座標軸上輸入n個矩形，問被這n個矩形覆蓋了兩次或兩次以上的區域的面積總和。給的題意有點問題，實際輸入是矩形的左下和右上，另外樣例1應該輸出7.62. 思路掃描線，這

2024-06-12 14:19:49

Python 調整PDF頁面尺寸大小

在處理PDF文件時，我們可能會遇到這樣的情況：原始PDF文檔不符合我們的閱讀習慣，或者需要適配不同顯示設備等。這時，我們就需要及時調整PDF文檔中的頁面尺寸，以滿足不同應用場景的需求。利用Python語言的高效性和靈活性，再結合Spire

2024-06-12 14:19:38

24小時熱門文章

最新文章

最新評論文章