Open zhizunbao84 opened 2 years ago
在日常生活中,出去游玩或者工作中会拍摄大量的图片,经常会在同一个场景拍摄多张图片,造成很多图片会相似。图片多了以后会占存储空间,有必要找出这些相似的图片进行删除等处理。
该类算法主要是分别计算各个图片的hash值,然后计算各个hash值的汉明距离,一般汉明距离在10以下表示相似,主要有ahash、dhash、phash等算法。但是在实际实践中发现,该类算法虽然速度快,但是准确性不如意。
该算法将图片分成RGB三个通道,通过计算每个通道的直方图的相似程度来确认两张图片是否相似。该算法准确性可以,但是速度比hash算法慢,现在采用的是这种算法。
还有其他诸如ssim等算法,未实践。网上查阅资料显示速度更慢。
在日常生活中,出去游玩或者工作中会拍摄大量的图片,经常会在同一个场景拍摄多张图片,造成很多图片会相似。图片多了以后会占存储空间,有必要找出这些相似的图片进行删除等处理。
hash算法
该类算法主要是分别计算各个图片的hash值,然后计算各个hash值的汉明距离,一般汉明距离在10以下表示相似,主要有ahash、dhash、phash等算法。但是在实际实践中发现,该类算法虽然速度快,但是准确性不如意。
三通道直方图法
该算法将图片分成RGB三个通道,通过计算每个通道的直方图的相似程度来确认两张图片是否相似。该算法准确性可以,但是速度比hash算法慢,现在采用的是这种算法。
其他算法
还有其他诸如ssim等算法,未实践。网上查阅资料显示速度更慢。