如何对batch的数据求Gram矩阵

Gram矩阵概念和理解

在风格迁移中,我们要比较生成图片和风格图片的相似性,评判标准就是通过计算Gram矩阵得到的。关于Gram矩阵的定义,可以参考[1]。

由这个矩阵的样子,很容易就想到协方差矩阵。如果协方差矩阵是什么忘了的化可以参考[2],可以看到Gram矩阵是没有减去均值的协方差矩阵。协方差矩阵是一种相关性度量的矩阵,通过协方差来度量相关性,也就是度量两个图片风格的相似性。(如果相对协方差和相关系数有进一步了解,可以参考[3])

如何通过代码实现Gram矩阵计算

了解Gram矩阵的概念和性质 ,我们就来看一看如何用代码来实现Gram矩阵的计算。这里,使用PyTorch来实现计算过程。

PyTorch中有两个函数torch.mmtorch.bmm前者是计算矩阵乘法,后者是计算batch数据的矩阵乘法,风格迁移中是对batch数据进行操作,所以使用bmm。

我们创造一个batch为2,单通道,2*2大小的数据

a = torch.arange(8, dtype=torch.int).reshape(2, 1, 2, 2)
a
>>> tensor([[[[0, 1],
          [2, 3]]],


        [[[4, 5],
          [6, 7]]]], dtype=torch.int32)

之后从新reshape一下,将w和h通道的数据合起来,变成向量形式

features = a.view(2, 1, 4)
features
>>>	tensor([[[0, 1, 2, 3]],

        [[4, 5, 6, 7]]], dtype=torch.int32)

为了构造计算Gram矩阵的向量,对shape进行一个交换操作

features_t = features.transpose(1, 2)
features_t
>>>	tensor([[[0],
         [1],
         [2],
         [3]],

        [[4],
         [5],
         [6],
         [7]]], dtype=torch.int32)

之后用矩阵乘法把这两个向量乘起来就可以了,就计算出Gram矩阵了。

gram = features.bmm(features_t)
gram
>>>	tensor([[[ 14]],

        [[126]]], dtype=torch.int32)

Reference

[1]Gram格拉姆矩阵在风格迁移中的应用
[2]如何直观地理解「协方差矩阵」
[3]如何通俗易懂地解释「协方差」与「相关系数」的概念?

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章