zhizunbao84 / mygitblog

People Die, but Long Live GitHub
MIT License
0 stars 0 forks source link

在大量图片中找出相似图片 #9

Open zhizunbao84 opened 2 years ago

zhizunbao84 commented 2 years ago

在日常生活中,出去游玩或者工作中会拍摄大量的图片,经常会在同一个场景拍摄多张图片,造成很多图片会相似。图片多了以后会占存储空间,有必要找出这些相似的图片进行删除等处理。

hash算法

该类算法主要是分别计算各个图片的hash值,然后计算各个hash值的汉明距离,一般汉明距离在10以下表示相似,主要有ahash、dhash、phash等算法。但是在实际实践中发现,该类算法虽然速度快,但是准确性不如意。

三通道直方图法

该算法将图片分成RGB三个通道,通过计算每个通道的直方图的相似程度来确认两张图片是否相似。该算法准确性可以,但是速度比hash算法慢,现在采用的是这种算法。

其他算法

还有其他诸如ssim等算法,未实践。网上查阅资料显示速度更慢。