用python自动分类整理照片的核心是读取exif信息并根据其内容创建文件夹移动文件。1. 安装pillow库用于图像处理;2. 编写脚本读取照片的exif数据,提取拍摄日期并按年月创建文件夹进行分类;3. 对于无exif信息的照片,可使用文件修改时间、手动分类或结合图像识别技术处理,并建立“未分类”文件夹统一管理;4. 可扩展至根据相机型号分类,提取exif中的型号信息创建对应目录;5. 利用gps信息按地理位置分类,借助exifread库读取经纬度并通过地理编码服务转换为地点名称;6. 优化效率方面,可采用多进程处理、批量操作、使用更快的图像库、避免重复读取以及使用ssd提升io速度。
想要用Python自动分类整理照片?核心就在于读取照片的EXIF信息,然后根据这些信息(比如拍摄日期、相机型号等)来创建文件夹并移动照片。
解决方案:
首先,你需要安装一个叫做Pillow的Python库,它可以用来处理图像,包括读取EXIF信息。使用pip install Pillow安装。
立即学习“Python免费学习笔记(深入)”;
接下来,就是编写Python脚本了。这是一个基本的例子:
from PIL import Image import os import shutil def organize_photos(source_dir, dest_dir): for filename in os.listdir(source_dir): if filename.endswith(('.jpg', '.jpeg', '.png', '.gif')): # 检查文件类型 filepath = os.path.join(source_dir, filename) try: img = Image.open(filepath) exif_data = img._getexif() if exif_data: # 提取拍摄日期,这里假设EXIF标签269对应日期时间 date_taken = exif_data.get(36867) or exif_data.get(306) # 36867是DateTimeOriginal,306是DateTime if date_taken: year_month = date_taken[:7].replace(":", "-") # 提取年月 target_dir = os.path.join(dest_dir, year_month) os.makedirs(target_dir, exist_ok=True) shutil.move(filepath, os.path.join(target_dir, filename)) print(f"Moved {filename} to {target_dir}") else: print(f"No date information found for {filename}") else: print(f"No EXIF data found for {filename}") except Exception as e: print(f"Error processing {filename}: {e}") # 使用示例 source_directory = "/path/to/your/photos" # 替换为你的照片源目录 destination_directory = "/path/to/your/organized/photos" # 替换为你的目标目录 organize_photos(source_directory, destination_directory)
这段代码会遍历指定目录下的所有图片,读取它们的EXIF信息,提取拍摄日期,然后根据年月创建文件夹,并将照片移动到对应的文件夹中。注意,EXIF信息的标签ID可能会因为相机型号而有所不同,你需要根据实际情况调整。
有些照片可能没有EXIF信息,或者EXIF信息不完整。针对这种情况,你可以考虑以下几种方法:
使用文件修改日期: 如果EXIF信息缺失,可以退而求其次,使用文件的修改日期作为分类的依据。os.path.getmtime()函数可以获取文件的修改时间戳,然后将其转换为日期格式。
import time file_modified_time = os.path.getmtime(filepath) date_taken = time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(file_modified_time))
手动分类: 对于少量无法自动分类的照片,手动创建文件夹并移动它们可能是最直接的办法。
结合图像识别技术: 如果照片内容有明显特征(比如风景、人像),可以尝试使用图像识别技术来辅助分类。但这需要更复杂的算法和模型,例如使用OpenCV或者TensorFlow。
建立一个“未分类”文件夹: 将所有无法确定分类的照片都放到一个“未分类”文件夹中,稍后再手动处理。
除了日期,你还可以根据相机型号或地理位置信息来分类照片。
根据相机型号分类: EXIF信息中通常包含相机型号的信息。你可以提取该信息,并根据相机型号创建文件夹。
camera_model = exif_data.get(272) # 272是Make,271是EquipmentMake,272是Model if camera_model: target_dir = os.path.join(dest_dir, str(camera_model)) os.makedirs(target_dir, exist_ok=True) shutil.move(filepath, os.path.join(target_dir, filename))
根据地理位置信息分类: 有些照片包含GPS信息。你可以使用第三方库(比如exifread)来读取这些信息,然后根据经纬度确定照片的拍摄地点,并根据地点创建文件夹。需要注意的是,处理GPS信息会稍微复杂一些,因为你需要将经纬度转换为可读的地点名称。可以使用地理编码服务,如Google Maps API,但可能需要付费。
import exifread with open(filepath, 'rb') as f: tags = exifread.process_file(f) latitude = tags.get('GPS GPSLatitude') longitude = tags.get('GPS GPSLongitude') if latitude and longitude: # 这里需要将经纬度转换为地点名称,可以使用地理编码服务 location = get_location_from_coordinates(latitude, longitude) target_dir = os.path.join(dest_dir, location) os.makedirs(target_dir, exist_ok=True) shutil.move(filepath, os.path.join(target_dir, filename))
如果你的照片数量非常庞大,那么分类过程可能会很慢。以下是一些优化效率的建议:
使用多线程或多进程: Python的threading或multiprocessing模块可以让你并行处理多个照片,从而提高分类速度。但是要注意,多线程可能会受到全局解释器锁(GIL)的限制,对于CPU密集型任务,多进程可能更适合。
批量处理: 不要一次处理一张照片,而是将照片分成批次,然后批量读取EXIF信息和移动文件。
使用更快的图像处理库: 虽然Pillow很常用,但可能不是最快的图像处理库。你可以尝试其他的库,比如opencv-python,看看是否能提高速度。
避免重复操作: 比如,如果已经读取了某个照片的EXIF信息,就不要再次读取。可以将EXIF信息缓存起来,下次直接使用。
使用固态硬盘(SSD): 如果你的照片存储在机械硬盘上,那么读取和写入速度可能会成为瓶颈。使用SSD可以显著提高速度。
总的来说,照片自动分类是一个很有趣的项目,它结合了文件操作、图像处理和数据分析。通过不断尝试和优化,你可以打造一个高效且智能的照片管理系统。
以上就是怎样用Python自动分类整理照片?EXIF信息读取与分类的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号