python怎么判断文件夹内的重复图片
这篇文章主要介绍python怎么判断文件夹内的重复图片,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!
1、步骤
如果要判断文件夹中是否有相同的图片,则需要对文件夹中的所有图片进行分类,并逐一判断两张图片是否相同。
如果文件夹中有1000张图片,则第一张图片需要与剩余的999张图片进行比较,第二张图片需要与剩余的998张图片进行比较,第三张图片需要与剩余的997张图片进行比较,以此类推。
这个程序的做法是,首先将所有的图片按照图片大小(byte)进行分类,然后再进行分类比较。结果是:重复图片很有可能连续出现(因为重复图片大小相同)
2、实例
if __name__ == '__main__': load_path = 'E:\\测试图片集(未去重)' # 要去重的文件夹 save_path = 'E:\\测试图片集(重复照片)' # 空文件夹,用于存储检测到的重复的照片 os.makedirs(save_path, exist_ok=True) # 获取图片列表 file_map,字典{文件路径filename : 文件大小image_size} file_map = {} image_size = 0 # 遍历filePath下的文件、文件夹(包括子目录) for parent, dirnames, filenames in os.walk(load_path): # for dirname in dirnames: # print('parent is %s, dirname is %s' % (parent, dirname)) for filename in filenames: # print('parent is %s, filename is %s' % (parent, filename)) # print('the full name of the file is %s' % os.path.join(parent, filename)) image_size = os.path.getsize(os.path.join(parent, filename)) file_map.setdefault(os.path.join(parent, filename), image_size) # 获取的图片列表按 文件大小image_size 排序 file_map = sorted(file_map.items(), key=lambda d: d[1], reverse=False) file_list = [] for filename, image_size in file_map: file_list.append(filename) # 取出重复的图片 file_repeat = [] for currIndex, filename in enumerate(file_list): dir_image1 = file_list[currIndex] dir_image2 = file_list[currIndex + 1] result = 比较两张图片是否相同(dir_image1, dir_image2) if(result == "两张图相同"): file_repeat.append(file_list[currIndex + 1]) print("\n相同的图片:", file_list[currIndex], file_list[currIndex + 1]) else: print('\n不同的图片:', file_list[currIndex], file_list[currIndex + 1]) currIndex += 1 if currIndex >= len(file_list)-1: break # 将重复的图片移动到新的文件夹,实现对原文件夹降重 for image in file_repeat: shutil.move(image, save_path) print("正在移除重复照片:", image)
python的五大特点是什么
python的五大特点:1.简单易学,开发程序时,专注的是解决问题,而不是搞明白语言本身。2.面向对象,与其他主要的语言如C++和Java相比, Python以一种非常强大又简单的方式实现面向对象编程。3.可移植性,Python程序无需修改就可以在各种平台上运行。4.解释性,Python语言写的程序不需要编译成二进制代码,可以直接从源代码运行程序。5.开源,Python是 FLOSS(自由/开放源码软件)之一。
以上是“python怎么判断文件夹内的重复图片”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注编程网行业资讯频道!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341