0

0

从图片EXIF数据中提取并校正GPS坐标的Python教程

霞舞

霞舞

发布时间:2025-11-20 14:50:33

|

474人浏览过

|

来源于php中文网

原创

从图片EXIF数据中提取并校正GPS坐标的Python教程

本教程详细阐述了如何使用python从图片exif数据中提取gps经纬度信息。文章深入解析了exif中gps数据的存储格式(度分秒),并重点讲解了如何根据经纬度参考(南北半球、东西半球)正确转换并应用符号,以避免常见的坐标错误。教程提供了完整的示例代码,并涵盖了使用`geopy`库进行反向地理编码,以及处理潜在问题和最佳实践。

1. 理解EXIF中的GPS数据结构

数码照片通常包含元数据,即EXIF(可交换图像文件格式)数据,其中可能包含拍摄时的GPS坐标信息。这些信息通常存储在GPSInfo字典中,以特定的标签ID表示。

关键的GPS EXIF标签包括:

  • GPSLatitude (标签ID 2): 纬度值,以度、分、秒(DMS)格式存储为一个元组,例如 (33, 51, 52.4)。
  • GPSLatitudeRef (标签ID 1): 纬度参考,指示纬度是北('N')还是南('S')。
  • GPSLongitude (标签ID 4): 经度值,同样以DMS格式存储。
  • GPSLongitudeRef (标签ID 3): 经度参考,指示经度是东('E')还是西('W')。

需要注意的是,GPSLatitude和GPSLongitude存储的是绝对值,其正负号取决于GPSLatitudeRef和GPSLongitudeRef。例如,南半球的纬度应为负值,西半球的经度也应为负值。

2. 将度分秒(DMS)格式转换为十进制经纬度

EXIF中的GPS数据通常以DMS格式存储,而大多数地理信息系统和API(如geopy)需要十进制格式。DMS到十进制的转换公式如下:

立即学习Python免费学习笔记(深入)”;

十进制经纬度 = 度 + (分钟 / 60) + (秒 / 3600)

GitHub Copilot
GitHub Copilot

GitHub AI编程工具,实时编程建议

下载

例如,如果纬度是 (33, 51, 52.4),则其十进制值为 33 + (51 / 60) + (52.4 / 3600)。

在转换过程中,必须结合GPSLatitudeRef和GPSLongitudeRef来确定最终的符号:

  • 如果GPSLatitudeRef为 'S' (South),则十进制纬度应乘以 -1。
  • 如果GPSLongitudeRef为 'W' (West),则十进制经度应乘以 -1。

这是解决纬度或经度符号错误的关键。例如,原始问题中用户在澳大利亚(南半球)拍照,但计算出的纬度为正值,导致被错误识别为日本。通过检查GPSLatitudeRef是否为'S'并应用负号,即可纠正此问题。

3. Python实现:提取、转换与反向地理编码

以下是一个完整的Python代码示例,演示如何从图片中提取EXIF GPS数据,将其转换为正确的十进制格式,并使用geopy库进行反向地理编码。

import PIL.Image
import PIL.ExifTags
from geopy.geocoders import Nominatim
from geopy.exc import GeocoderTimedOut, GeocoderServiceError

def get_exif_data(image_path):
    """
    从指定路径的图片中提取EXIF数据。
    返回一个字典,其中键为EXIF标签名,值为对应的EXIF数据。
    """
    try:
        img = PIL.Image.open(image_path)
        exif_data = img._getexif()
        if exif_data is None:
            return {}

        # 将EXIF标签ID映射到可读的标签名
        exif = {
            PIL.ExifTags.TAGS.get(k, k): v
            for k, v in exif_data.items()
        }
        return exif
    except Exception as e:
        print(f"读取EXIF数据时发生错误: {e}")
        return {}

def convert_dms_to_decimal(dms_tuple, ref):
    """
    将度、分、秒(DMS)元组转换为十进制经纬度。
    并根据参考('N', 'S', 'E', 'W')应用正确的符号。
    """
    if not isinstance(dms_tuple, tuple) or len(dms_tuple) != 3:
        raise ValueError("DMS元组格式不正确,应为 (degrees, minutes, seconds)")

    # PIL库中的DMS值通常是分数形式 (numerator, denominator)
    # 需要将其转换为浮点数
    degrees = float(dms_tuple[0][0]) / dms_tuple[0][1] if isinstance(dms_tuple[0], tuple) else float(dms_tuple[0])
    minutes = float(dms_tuple[1][0]) / dms_tuple[1][1] if isinstance(dms_tuple[1], tuple) else float(dms_tuple[1])
    seconds = float(dms_tuple[2][0]) / dms_tuple[2][1] if isinstance(dms_tuple[2], tuple) else float(dms_tuple[2])

    decimal_degrees = degrees + (minutes / 60.0) + (seconds / 3600.0)

    if ref in ['S', 'W']:
        decimal_degrees *= -1
    return decimal_degrees

def get_gps_coordinates(exif_data):
    """
    从EXIF数据中提取并转换GPS坐标。
    返回 (latitude, longitude) 元组,如果无法获取则返回 (None, None)。
    """
    gps_info = exif_data.get('GPSInfo')
    if not gps_info:
        return None, None

    # GPSInfo中的标签通常是数字ID,需要映射到GPSTAGS中的名称
    # PIL.ExifTags.GPSTAGS 是一个反向映射 (tag_name: tag_id)
    # 我们需要 (tag_id: tag_name)
    gps_tag_id_to_name = {v: k for k, v in PIL.ExifTags.GPSTAGS.items()}

    # 使用映射后的ID来获取数据
    latitude_dms = gps_info.get(gps_tag_id_to_name.get('GPSLatitude'))
    latitude_ref = gps_info.get(gps_tag_id_to_name.get('GPSLatitudeRef'))
    longitude_dms = gps_info.get(gps_tag_id_to_name.get('GPSLongitude'))
    longitude_ref = gps_info.get(gps_tag_id_to_name.get('GPSLongitudeRef'))

    if all([latitude_dms, latitude_ref, longitude_dms, longitude_ref]):
        try:
            lat = convert_dms_to_decimal(latitude_dms, latitude_ref)
            lon = convert_dms_to_decimal(longitude_dms, longitude_ref)
            return lat, lon
        except ValueError as e:
            print(f"DMS转换错误: {e}")
            return None, None
    return None, None

# --- 主程序执行 ---
# 请替换为你的图片文件路径
image_path = r"C:\Users\RGCRA\Pictures\Camera Roll\WIN_20240102_11_46_09_Pro.jpg" 

print(f"正在处理图片: {image_path}")

exif = get_exif_data(image_path)
if not exif:
    print("未找到EXIF数据或读取图片时发生错误。")
else:
    latitude, longitude = get_gps_coordinates(exif)

    if latitude is not None and longitude is not None:
        print(f"提取并校正后的GPS坐标: 纬度={latitude}, 经度={longitude}")

        # 使用Nominatim进行反向地理编码
        try:
            # 必须提供一个唯一的user_agent,以遵守Nominatim的使用政策
            geoLoc = Nominatim(user_agent='EXIF_GPS_Tutorial_App') 
            # 增加超时设置,避免网络请求无限等待
            locname = geoLoc.reverse(f"{latitude}, {longitude}", timeout=10) 
            if locname:
                print(f"反向地理编码地址: {locname.address}")
            else:
                print("无法对坐标进行反向地理编码。")
        except GeocoderTimedOut:
            print("地理编码服务超时。请稍后重试。")
        except GeocoderServiceError as e:
            print(f"地理编码服务错误: {e}")
        except Exception as e:
            print(f"反向地理编码过程中发生意外错误: {e}")
    else:
        print("图片EXIF数据中未找到有效的GPS坐标。")

4. 注意事项与最佳实践

  1. EXIF数据存在性检查: 并非所有图片都包含EXIF数据,更不是所有包含EXIF数据的图片都有GPS信息。在处理之前,务必检查_getexif()的返回值以及GPSInfo字典是否存在。
  2. 数据格式: PIL库在处理EXIF数据时,DMS元组中的度、分、秒可能以分数形式(例如 (分子, 分母))存储。上述convert_dms_to_decimal函数已更新以处理这种情况。
  3. geopy的user_agent: 使用Nominatim等地理编码服务时,必须提供一个描述性的user_agent字符串,以遵守服务提供商的使用政策。
  4. 网络请求超时: 反向地理编码是网络请求,可能会因为网络问题而延迟或失败。设置timeout参数可以避免程序无限等待。
  5. 错误处理: 在实际应用中,应加入更完善的错误处理机制,例如捕获文件不存在、EXIF数据损坏、网络请求失败等异常。
  6. 隐私问题: GPS数据可能包含敏感的个人位置信息。在处理和分享包含此类信息的图片时,请注意隐私保护。
  7. 坐标精度: 图像EXIF中的GPS数据精度取决于拍摄设备。并非所有设备的GPS都提供高精度数据。

总结

通过本教程,我们学习了如何利用Python的PIL库提取图片EXIF中的GPS数据,并解决了将度分秒格式转换为十进制经纬度时,因半球参考(南北、东西)导致的正负号问题。正确处理GPSLatitudeRef和GPSLongitudeRef是确保坐标准确性的关键。结合geopy库进行反向地理编码,可以进一步验证提取出的位置信息,为图片处理和地理位置分析提供了强大的工具。在实际应用中,务必注意数据完整性、错误处理和用户隐私。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

745

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

634

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

757

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

617

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1259

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

705

2023.08.11

c++主流开发框架汇总
c++主流开发框架汇总

本专题整合了c++开发框架推荐,阅读专题下面的文章了解更多详细内容。

80

2026.01.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Django 教程
Django 教程

共28课时 | 3万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号