1. SSIM(結構相似性度量)
這是一種全參考的圖像質量評價指標,分別從亮度、對比度、結構三個方面度量圖像相似性。
SSIM取值範圍[0, 1],值越大,表示圖像失真越小。
在實際應用中,可以利用滑動窗將圖像分塊,令分塊總數爲N,考慮到窗口形狀對分塊的影響,採用高斯加權計算每一窗口的均值、方差以及協方差,然後計算對應塊的結構相似度SSIM,最後將平均值作爲兩圖像的結構相似性度量,即平均結構相似性SSIM。
from skimage.measure import compare_ssim
from scipy.misc import imread
import numpy as np
img1 = imread('1.jpg')
img2 = imread('2.jpg')
img2 = np.resize(img2, (img1.shape[0], img1.shape[1], img1.shape[2]))
print(img2.shape)
print(img1.shape)
ssim = compare_ssim(img1, img2, multichannel=True)
print(ssim)
計算出來SSIM爲0.343769017234
該方法通常用來衡量一張圖片壓縮後的失真度,比較少的用來計算兩圖的相似度。
2. cosin相似度(餘弦相似度)
把圖片表示成一個向量,通過計算向量之間的餘弦距離來表徵兩張圖片的相似度。
from PIL import Image
from numpy import average, linalg, dot
def get_thumbnail(image, size=(1200, 750), greyscale=False):
image = image.resize(size, Image.ANTIALIAS)
if greyscale:
image = image.convert('L')
return image
def image_similarity_vectors_via_numpy(image1, image2):
image1 = get_thumbnail(image1)
image2 = get_thumbnail(image2)
images = [image1, image2]
vectors = []
norms = []
for image in images:
vector = []
for pixel_tuple in image.getdata():
vector.append(average(pixel_tuple))
vectors.append(vector)
norms.append(linalg.norm(vector, 2))
a, b = vectors
a_norm, b_norm = norms
res = dot(a / a_norm, b / b_norm)
return res
image1 = Image.open('1.jpg')
image2 = Image.open('2.jpg')
cosin = image_similarity_vectors_via_numpy(image1, image2)
print(cosin)
計算出來cosin相似度爲0.911241243612
該方法運算量較大,速度明顯比ssim方法慢,但是隻管感受結果比ssim靠譜。
3. 基於直方圖
直方圖能夠描述一幅圖像中顏色的全局分佈,是一種入門級的圖像相似度計算方法。
from PIL import Image
def make_regalur_image(img, size = (256, 256)):
return img.resize(size).convert('RGB')
def hist_similar(lh, rh):
assert len(lh) == len(rh)
return sum(1 - (0 if l == r else float(abs(l - r))/max(l, r)) for l, r in zip(lh, rh))/len(lh)
def calc_similar(li, ri):
return hist_similar(li.histogram(), ri.histogram())
if __name__ == '__main__':
img1 = Image.open('1.jpg')
img1 = make_regalur_image(img1)
img2 = Image.open('2.jpg')
img2 = make_regalur_image(img2)
print(calc_similar(img1, img2))
計算出來的直方圖相似度爲0.490183408809
直方圖過於簡單,只能捕捉顏色信息的相似性,捕捉不到更多的信息。只要顏色分佈相似,就會判定二者相似度較高,顯然不合理。
4. 基於互信息(Mutual Information)
通過計算兩個圖片的互信息來表徵他們之間的相似度。
from sklearn import metrics as mr
from scipy.misc import imread
import numpy as np
img1 = imread('1.jpg')
img2 = imread('2.jpg')
img2 = np.resize(img2, (img1.shape[0], img1.shape[1], img1.shape[2]))
img1 = np.reshape(img1, -1)
img2 = np.reshape(img2, -1)
print(img2.shape)
print(img1.shape)
mutual_infor = mr.mutual_info_score(img1, img2)
print(mutual_infor)
如果兩張圖片尺寸相同,還是能在一定程度上表徵兩張圖片的相似性的。但是,大部分情況下圖片的尺寸不相同,如果把兩張圖片尺寸調成相同的話,又會讓原來很多的信息丟失,所以很難把握。經過實際驗證,此種方法的確很難把握。
5. 計算圖像的“指紋信息”
將圖像歸一化成一定大小,計算 一個序列作爲他的指紋信息,然後比較兩張圖片指紋信息序列相同的位數。如果不相同的數據位不超過5,就說明兩張圖片很相似;如果大於10,就說明這是兩張不同的圖片。
# 均值哈希算法
def aHash(img):
# 縮放爲8*8
img = cv2.resize(img, (8, 8), interpolation=cv2.INTER_CUBIC)
# 轉換爲灰度圖
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# s爲像素和初值爲0,hash_str爲hash值初值爲''
s = 0
hash_str = ''
# 遍歷累加求像素和
for i in range(8):
for j in range(8):
s = s + gray[i, j]
# 求平均灰度
avg = s / 64
# 灰度大於平均值爲1相反爲0生成圖片的hash值
for i in range(8):
for j in range(8):
if gray[i, j] > avg:
hash_str = hash_str + '1'
else:
hash_str = hash_str + '0'
return hash_str
# 差值感知算法
def dHash(img):
# 縮放8*8
img = cv2.resize(img, (9, 8), interpolation=cv2.INTER_CUBIC)
# 轉換灰度圖
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
hash_str = ''
# 每行前一個像素大於後一個像素爲1,相反爲0,生成哈希
for i in range(8):
for j in range(8):
if gray[i, j] > gray[i, j + 1]:
hash_str = hash_str + '1'
else:
hash_str = hash_str + '0'
return hash_str
# Hash值對比
def cmpHash(hash1, hash2):
n = 0
# hash長度不同則返回-1代表傳參出錯
if len(hash1) != len(hash2):
return -1
# 遍歷判斷
for i in range(len(hash1)):
# 不相等則n計數+1,n最終爲相似度
if hash1[i] != hash2[i]:
n = n + 1
return n
# 如果不相同的數據位不超過5,就說明兩張圖片很相似;如果大於10,就說明這是兩張不同的圖片。
def img_hash(img1, img2):
hash1 = aHash(img1)
hash2 = aHash(img2)
an = cmpHash(hash1, hash2)
print '均值哈希算法相似度:' + str(an)
hash1 = dHash(img1)
hash2 = dHash(img2)
dn = cmpHash(hash1, hash2)
print '差值哈希算法相似度:' + str(dn)
# img1 = cv2.imread('a.jpg')
# # img2 = cv2.imread('D:/05/14/5373d896-27eb-4804-af79-8fac72621a27.jpg')
# img2 = cv2.imread('b.jpg')
img_hash(img1, img2 )
參考: https://blog.csdn.net/u010977034/article/details/82733137
https://blog.csdn.net/weixin_39121325/article/details/84187453,
https://blog.csdn.net/counte_rking/article/details/78834644,