论文阅读笔记《Adaptive Subspaces for Few-Shot Learning》

原創

2020-07-02 15:26

核心思想

本文提出一种基于度量学习的小样本分类算法（DSN）。作者引入了子空间的概念，为每种类别都寻找到一个适合的子空间，然后在子空间中进行距离度量，并预测类别。首先作者介绍了几种常见的基于度量学习的小样本分类器，其分类方式如下图所示

（a）成对的分类器，分别计算查询样本对应的特征向量和每个支持样本对应的特征向量之间的距离，然后按照最近邻的思想预测类别，如Matching Network。
（b）原型分类器，为支持集中每个类别计算出一个原型（每个类别所有样本特征向量的平均值），然后根据查询样本的特征向量与各个类别原型之间的距离预测类别，如Prototypical Network。
（c）非线性二元分类器，利用神经网络学习到一个非线性的距离度量函数，如Relation Network。
（d）子空间分类器，为每个类别计算出一个特征空间的子空间，然后将查询样本的特征向量投射到子空间中，在子空间中进行距离度量，并预测类别，如本文的算法（DSN）。DSN的处理过程如下图所示

首先，利用特征提取器 $f_{\Theta}$ 将输入图像映射到特征空间中得到对应的特征向量 $f_{\Theta}(x_i)$ ，然后通过平均的方式计算每个类别 $c$ 对应的特征向量均值 $\mu_c$ ，计算过程如下

对于每个类别 $c$ 都可以得到集合 $\tilde{X}_c=[f_{\Theta}(x_{c,1})-\mu_c,...,f_{\Theta}(x_{c,K})-\mu_c]$ ，对 $\tilde{X}_c$ 进行奇异值分解（SVD）得到 $\tilde{X}_c=U\sum V^T$ ，然后选取 $U$ 中前 $n$ 个维度得到截断矩阵 $P_c$ ，由 $\tilde{X}_c$ 得到子空间 $P_c$ 的过程其实就是截断奇异值分解（TSVD）,其与主成分分析PCA非常类似，是一种数据降维的方法。得到每个类别对应的子空间 $P_c$ 后，可以计算查询向量 $f_{\Theta}(q)$ 与每个类别之间的距离 $d(q)$ ，计算过程如下

式中 $M_c=P_cP_c^T$ ，最后利用softmax函数计算查询样本属于各个类别的概率 $p_{c,q}$ ，计算过程如下