python图像识别之图片相似度计算

时间：2019-11-20 11:35:27 来源：作者：

作者 | a1131825850疯子

来源 | Python爬虫scrapy

1.背景

要识别两张图片是否相似，首先我们可能会区分这两张图是人物照，还是风景照等......对应的风景照是蓝天还是大海......做一系列的分类。

从机器学习的的角度来说，首先要提取图片的特征，将这些特征进行分类处理，训练并建立模型，然后在进行识别。

但是让计算机去区分这些图片分别是哪一类是很不容易的，不过计算机可以知道图像的像素值的，因此，在图像识别过程中，通过颜色特征来识别是相似图片是我们常用的（当然还有其特征还有纹理特征、形状特征和空间关系特征等，这些有分为直方图，颜色集，颜色局，聚合向量，相关图等来计算颜色特征），

为了得到两张相似的图片，在这里通过以下几种简单的计算方式来计算图片的相似度：

直方图计算图片的相似度

通过哈希值，汉明距离计算

通过图片的余弦距离计算

通过图片结构度量计算

一、直方图计算图片的相似度

上三张图片，分别是img1.png, img2.jpg,img.png：

可以看出上面这三张图是挺相似的，在颜色上是差不多的，最相似的是哪两张大家可以猜猜看，看和我们计算的是否一样。

在python中利用opencv中的calcHist()方法获取其直方图数据，返回的结果是一个列表：

# 计算图img1的直方图H1 = cv2.calcHist([img1], [1], None, [256], [0, 256])H1 = cv2.normalize(H1, H1, 0, 1, cv2.NORM_MINMAX, -1) # 对图片进行归一化处理

先计算img1的直方图，在对其归一化，最后在分别对img2,img3计算，做归一化，然后在利用python自带的compareHist()进行相似度的比较：

 利用compareHist（）进行比较相似度similarity1 = cv2.compareHist(H1, H2, 0)

最后得到三张图片的直方图如下：

图像的x轴是指的图片的0~255之间的像素变化，y轴指的是在这0~255像素所占的比列。

我们可以明显的看出img2与img3的直方图的变化趋势是相符的有重合态的，运行结果如下：

通过运行结果知道img2和img3是值是最为相似的（代码calcImage.py）

上面的是直接调用opencv中的方法来实现的，下面还有自己写的方法：

首先是将图片转化为RGB格式，在这里是用的pillow中的Image来对图片做处理的：

# 将图片转化为RGBdef make_regalur_image(img, size=(64, 64)): gray_image = img.resize(size).convert('RGB') return gray_image

在计算两图片的直方图：

# 计算直方图def hist_similar(lh, rh): assert len(lh) == len(rh) hist = sum(1 - (0 if l == r else float(abs(l - r)) / max(l, r)) for l, r in zip(lh, rh)) / len(lh) return hist

在计算其相似度:

# 计算相似度def calc_similar(li, ri): calc_sim = hist_similar(li.histogram(), ri.histogram())returncalc_sim

得到最终的运行结果：

两种方法的的结果还是有点差距的，可以看到img1和img3的结果相似度高些。

不过两者的相似度计算方法如下：

gi和si分别指的是两条曲线的第i个点。

总结：

利用直方图计算图片的相似度时，是按照颜色的全局分布情况来看待的，无法对局部的色彩进行分析，同一张图片如果转化成为灰度图时，在计算其直方图时差距就更大了。

为了解决这个问题，可以将图片进行等分，然后在计算图片的相似度。不过在这里我就不叙述了，大家自行探讨！！！

二、哈希算法计算图片的相似度

在计算之前我们先了解一下图像指纹和汉明距离：

图像指纹：

图像指纹和人的指纹一样，是身份的象征，而图像指纹简单点来讲，就是将图像按照一定的哈希算法，经过运算后得出的一组二进制数字。

汉明距离：

假如一组二进制数据为101，另外一组为111，那么显然把第一组的第二位数据0改成1就可以变成第二组数据111，所以两组数据的汉明距离就为1。简单点说，汉明距离就是一组二进制数据变成另一组数据所需的步骤数，显然，这个数值可以衡量两张图片的差异，汉明距离越小，则代表相似度越高。汉明距离为0，即代表两张图片完全一样。

感知哈希算法是一类算法的总称，包括aHash、pHash、dHash。顾名思义，感知哈希不是以严格的方式计算Hash值，而是以更加相对的方式计算哈希值，因为“相似”与否，就是一种相对的判定。

几种hash值的比较：

aHash：平均值哈希。速度比较快，但是常常不太精确。

pHash：感知哈希。精确度比较高，但是速度方面较差一些。

dHash：差异值哈希。精确度较高，且速度也非常快

1. 平均哈希算法（aHash）：

该算法是基于比较灰度图每个像素与平均值来实现。

aHash的hanming距离步骤：

先将图片压缩成8*8的小图

将图片转化为灰度图

计算图片的Hash值，这里的hash值是64位，或者是32位01字符串

将上面的hash值转换为16位的

通过hash值来计算汉明距离

# 均值哈希算法def ahash(image): # 将图片缩放为8*8的 image = cv2.resize(image, (8, 8), interpolation=cv2.INTER_CUBIC) # 将图片转化为灰度图 gray = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY) # s为像素和初始灰度值，hash_str为哈希值初始值 s = 0 # 遍历像素累加和 for i in range(8): for j in range(8): s = s + gray[i, j] # 计算像素平均值 avg = s / 64 # 灰度大于平均值为1相反为0，得到图片的平均哈希值，此时得到的hash值为64位的01字符串 ahash_str = '' for i in range(8): for j in range(8): if gray[i, j] > avg: ahash_str = ahash_str + '1' else: ahash_str = ahash_str + '0' result = '' for i in range(0, 64, 4): result += ''.join('%x' % int(ahash_str[i: i + 4], 2)) # print("ahash值：",result) return result

2.感知哈希算法（pHash）：

均值哈希虽然简单，但是受均值影响大。如果对图像进行伽马校正或者进行直方图均值化都会影响均值，从而影响哈希值的计算。所以就有人提出更健壮的方法，通过离散余弦（DCT）进行低频提取。

离散余弦变换（DCT）是种图像压缩算法，它将图像从像素域变换到频率域。然后一般图像都存在很多冗余和相关性的，所以转换到频率域之后，只有很少的一部分频率分量的系数才不为0，大部分系数都为0（或者说接近于0）。

pHash的计算步骤：

缩小图片：32 * 32是一个较好的大小，这样方便DCT计算转化为灰度图

计算DCT：利用Opencv中提供的dct()方法，注意输入的图像必须是32位浮点型，所以先利用numpy中的float32进行转换

缩小DCT：DCT计算后的矩阵是32 * 32，保留左上角的8 * 8，这些代表的图片的最低频率

计算平均值：计算缩小DCT后的所有像素点的平均值。

进一步减小DCT：大于平均值记录为1，反之记录为0.

得到信息指纹：组合64个信息位，顺序随意保持一致性。

最后比对两张图片的指纹，获得汉明距离即可。

# phashdef phash(path): # 加载并调整图片为32*32的灰度图片 img = cv2.imread(path) img1 = cv2.resize(img, (32, 32),cv2.COLOR_RGB2GRAY) # 创建二维列表 h, w = img.shape[:2] vis0 = np.zeros((h, w), np.float32) vis0[:h, :w] = img1 # DCT二维变换 # 离散余弦变换，得到dct系数矩阵 img_dct = cv2.dct(cv2.dct(vis0)) img_dct.resize(8,8) # 把list变成一维list img_list = np.array().flatten(img_dct.tolist()) # 计算均值 img_mean = cv2.mean(img_list) avg_list = ['0' if i<img_mean else '1' for i in img_list] return ''.join(['%x' % int(''.join(avg_list[x:x+4]),2) for x in range(0,64,4)])

3. 差异值哈希算法（dHash）：

相比pHash，dHash的速度要快的多，相比aHash，dHash在效率几乎相同的情况下的效果要更好，它是基于渐变实现的。

dHash的hanming距离步骤：

先将图片压缩成9*8的小图，有72个像素点

将图片转化为灰度图

计算差异值：dHash算法工作在相邻像素之间，这样每行9个像素之间产生了8个不同的差异，一共8行，则产生了64个差异值，或者是32位01字符串。

获得指纹：如果左边的像素比右边的更亮，则记录为1，否则为0.

通过hash值来计算汉明距离

# 差异值哈希算法def dhash(image): # 将图片转化为8*8 image = cv2.resize(image, (9, 8), interpolation=cv2.INTER_CUBIC) # 将图片转化为灰度图 gray = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY) dhash_str = '' for i in range(8): for j in range(8): if gray[i, j] > gray[i, j + 1]: dhash_str = dhash_str + '1' else: dhash_str = dhash_str + '0' result = '' for i in range(0, 64, 4): result += ''.join('%x' % int(dhash_str[i: i + 4], 2)) # print("dhash值",result)returnresult

4. 计算哈希值差异

#计算两个哈希值之间的差异def campHash(hash1, hash2): n = 0 # hash长度不同返回-1,此时不能比较 if len(hash1) != len(hash2): return -1 # 如果hash长度相同遍历长度 for i in range(len(hash1)): if hash1[i] != hash2[i]: n = n + 1 return n

最终的运行结果：

aHash:

dhash：

p_hsah:

通过上面运行的结果可以看出来，img1和img2的相似度高一些。

三、余弦相似度(cosin)

把图片表示成一个向量，通过计算向量之间的余弦距离来表征两张图片的相似度。

1. 对图片进行归一化处理

# 对图片进行统一化处理def get_thum(image, size=(64, 64), greyscale=False): # 利用image对图像大小重新设置, Image.ANTIALIAS为高质量的 image = image.resize(size, Image.ANTIALIAS) if greyscale: # 将图片转换为L模式，其为灰度图，其每个像素用8个bit表示 image = image.convert('L') return image

2. 计算余弦距离

# 计算图片的余弦距离def image_similarity_vectors_via_numpy(image1, image2): image1 = get_thum(image1) image2 = get_thum(image2) images = [image1, image2] vectors = [] norms = [] for image in images: vector = [] for pixel_tuple in image.getdata(): vector.Append(average(pixel_tuple)) vectors.append(vector) # linalg=linear（线性）+algebra（代数），norm则表示范数 # 求图片的范数？？ norms.append(linalg.norm(vector, 2)) a, b = vectors a_norm, b_norm = norms # dot返回的是点积，对二维数组（矩阵）进行计算 res = dot(a / a_norm, b / b_norm)returnres

最终运行结果：

结果显示img1和img2的相似度高一些，和计算hash值的汉明距离得到的结果是相一致的。

四、图片SSIM(结构相似度量)

SSIM是一种全参考的图像质量评价指标，分别从亮度、对比度、结构三个方面度量图像相似性。SSIM取值范围[0, 1]，值越大，表示图像失真越小。在实际应用中，可以利用滑动窗将图像分块，令分块总数为N，考虑到窗口形状对分块的影响，采用高斯加权计算每一窗口的均值、方差以及协方差，然后计算对应块的结构相似度SSIM，最后将平均值作为两图像的结构相似性度量，即平均结构相似性SSIM。

ssim1 = compare_ssim(img1, img2, multichannel=True)

这个是scikit-image库自带的一种计算方法

运行结果：

可以看到img1和img2的相似度高。

好了，以上就是到目前为止我接触到的图片相似度的计算方法，肯定还有许多我没有接触到的计算方法，大家有需要的可以参考一下，有其他方法的大家可以留言一起探讨！！！

Tags：python 图像识别点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

python图像识别之图片相似度计算

要识别两张图片是否相似，首先我们可能会区分这两张图是人物照，还是风景照等......对应的风景照是蓝天还是大海......做一系列的分类。...【详细内容】

2019-11-20　　Tags: python 图像识别点击:(49)　　评论:(0)　　加入收藏

▌简易百科推荐

Python4要来了？快来看看Python之父怎么说

大家好，我是菜鸟哥，今天跟大家一起聊一下Python4的话题！从2020年的1月1号开始，Python官方正式的停止了对于Python2的维护。Python也正式的进入了Python3的时代。而随着时间的...【详细内容】

2021-12-28　　菜鸟学python　　　　Tags:Python4 　点击:(1)　　评论:(0)　　加入收藏

Python如何构建自动在线刷视频

学习Python的初衷是因为它的实践的便捷性，几乎计算机上能完成的各种操作都能在Python上找到解决途径。平时工作需要在线学习。而在线学习的复杂性经常让人抓狂。费时费力且效...【详细内容】

2021-12-28　　风度翩翩的Python　　　　Tags:Python 　点击:(1)　　评论:(0)　　加入收藏

非常实用的 Python 库，推一次火一次

Python 是一个很棒的语言。它是世界上发展最快的编程语言之一。它一次又一次地证明了在开发人员职位中和跨行业的数据科学职位中的实用性。整个 Python 及其库的生态系统使...【详细内容】

2021-12-27　　IT资料库　　　　Tags:Python 库　点击:(2)　　评论:(0)　　加入收藏

Python中的菜单驱动程序

菜单驱动程序简介菜单驱动程序是通过显示选项列表从用户那里获取输入并允许用户从选项列表中选择输入的程序。菜单驱动程序的一个简单示例是 ATM（自动取款机）。在交易的情况下...【详细内容】

2021-12-27　　子冉爱python　　　　Tags:Python 　点击:(4)　　评论:(0)　　加入收藏

15个Python入门小程序，你都知道哪些

有不少同学学完Python后仍然很难将其灵活运用。我整理15个Python入门的小程序。在实践中应用Python会有事半功倍的效果。01 实现二元二次函数实现数学里的二元二次函数：f(x,...【详细内容】

2021-12-22　　程序汪小成　　　　Tags:Python入门　点击:(32)　　评论:(0)　　加入收藏

用Python提取Verilog网表层次和实例化关系

Verilog是由一个个module组成的，下面是其中一个module在网表中的样子，我只需要提取module名字、实例化关系。module rst_filter ( ...); 端口声明... wire定义......【详细内容】

2021-12-22　　编程啊青　　　　Tags:Verilog 　点击:(9)　　评论:(0)　　加入收藏

使用 Python 将 MP4视频转换为GIF动画

运行环境如何从 MP4 视频中提取帧将帧变成 GIF 创建 MP4 到 GIF GUI ...【详细内容】

2021-12-22　　修道猿　　　　Tags:Python 　点击:(6)　　评论:(0)　　加入收藏

python的面向对象编程

面向对象：Object Oriented Programming，简称OOP，即面向对象程序设计。类(Class)和对象(Object)类是用来描述具有相同属性和方法对象的集合。对象是类的具体实例。比如，学生都有...【详细内容】

2021-12-22　　我头秃了　　　　Tags:python 　点击:(9)　　评论:(0)　　加入收藏

python初学者必须吃透的这些内置函数

所谓内置函数，就是Python提供的, 可以直接拿来直接用的函数，比如大家熟悉的print，range、input等，也有不是很熟，但是很重要的，如enumerate、zip、join等，Python内置的这些函数非常...【详细内容】

2021-12-21　　程序员小新ds　　　　Tags:python初　点击:(5)　　评论:(0)　　加入收藏

Python实现各种加密，接口加解密不说难

Hi，大家好。我们在接口自动化测试项目中，有时候需要一些加密。今天给大伙介绍Python实现各种加密，接口加解密再也不愁。目录一、项目加解密需求分析六、Python加密库PyCrypto...【详细内容】

2021-12-21　　Python可乐　　　　Tags:Python 　点击:(8)　　评论:(0)　　加入收藏

推荐资讯

聊聊如何自定义数据脱	河南人到底有多爱吃面
人称“犬中四煞”的4	离婚后，约定每月给孩子
“三皇五帝”分别是哪	印度低种姓群体如何翻
日本研发“飞行摩托”	2021年Steam最畅销游