Gram矩阵概念和理解
在风格迁移中,我们要比较生成图片和风格图片的相似性,评判标准就是通过计算Gram矩阵得到的。关于Gram矩阵的定义,可以参考[1]。
由这个矩阵的样子,很容易就想到协方差矩阵。如果协方差矩阵是什么忘了的化可以参考[2],可以看到Gram矩阵是没有减去均值的协方差矩阵。协方差矩阵是一种相关性度量的矩阵,通过协方差来度量相关性,也就是度量两个图片风格的相似性。(如果相对协方差和相关系数有进一步了解,可以参考[3])
如何通过代码实现Gram矩阵计算
了解Gram矩阵的概念和性质 ,我们就来看一看如何用代码来实现Gram矩阵的计算。这里,使用PyTorch来实现计算过程。
PyTorch中有两个函数torch.mm
和torch.bmm
前者是计算矩阵乘法,后者是计算batch数据的矩阵乘法,风格迁移中是对batch数据进行操作,所以使用bmm。
我们创造一个batch为2,单通道,2*2大小的数据
a = torch.arange(8, dtype=torch.int).reshape(2, 1, 2, 2)
a
>>> tensor([[[[0, 1],
[2, 3]]],
[[[4, 5],
[6, 7]]]], dtype=torch.int32)
之后从新reshape一下,将w和h通道的数据合起来,变成向量形式
features = a.view(2, 1, 4)
features
>>> tensor([[[0, 1, 2, 3]],
[[4, 5, 6, 7]]], dtype=torch.int32)
为了构造计算Gram矩阵的向量,对shape进行一个交换操作
features_t = features.transpose(1, 2)
features_t
>>> tensor([[[0],
[1],
[2],
[3]],
[[4],
[5],
[6],
[7]]], dtype=torch.int32)
之后用矩阵乘法把这两个向量乘起来就可以了,就计算出Gram矩阵了。
gram = features.bmm(features_t)
gram
>>> tensor([[[ 14]],
[[126]]], dtype=torch.int32)
Reference
[1]Gram格拉姆矩阵在风格迁移中的应用
[2]如何直观地理解「协方差矩阵」
[3]如何通俗易懂地解释「协方差」与「相关系数」的概念?