
`typing.annotated`在python中用于为类型提示附加元数据,但在某些场景下,我们需要获取其纯粹的、不含注解的原始类型结构。本文将详细介绍一种无需正则表达式的递归方法,通过遍历类型提示树,识别并剥离所有`annotated`包装,从而还原出底层类型,并提供示例代码和详细解释,确保类型结构的准确还原。
typing.Annotated 是 Python 3.9 引入的一个强大特性,它允许开发者在类型提示中嵌入额外的元数据,而这些元数据不会影响类型检查器的行为。例如,你可以为 int 类型添加一个描述,说明它代表一个用户ID,或者为 str 类型添加一个正则模式,指示其预期格式。
from typing import Annotated
UserID = Annotated[int, "The unique identifier for a user"]
Email = Annotated[str, "A valid email address", r"^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$"]
def get_user_id() -> UserID:
# ... implementation ...
return 123
def validate_email(email: Email) -> bool:
# ... implementation using the regex metadata ...
return True这种机制在运行时可以通过 typing.get_args 等函数访问这些元数据,为类型提示赋予更丰富的语义,常用于API文档生成、数据验证或代码生成等场景。
尽管 Annotated 提供了极大的灵活性,但在某些情况下,我们可能需要获取一个类型提示的“裸”版本,即剥离所有 Annotated 包装及其元数据,只保留其核心的类型结构。考虑以下复杂类型别名:
from typing import Annotated, tuple, list Point3D = Annotated[tuple[float, float, float], "A 3D Point"] Points = Annotated[list[Point3D | list[float]], "A collection of points"]
当我们尝试直接打印 Points 时,会得到一个包含所有 Annotated 信息的冗长字符串:
立即学习“Python免费学习笔记(深入)”;
typing.Annotated[list[typing.Annotated[tuple[float, float, float], 'A 3D Point'] | list[float]], 'A collection of points']
如果我们的目标是仅获取 list[tuple[float, float, float] | list[float]] 这样的纯粹类型结构,直接使用 typing.get_args(Points)[0] 只能剥离最外层的 Annotated,内部嵌套的 Annotated 仍然存在,例如:
list[typing.Annotated[tuple[float, float, float], 'A 3D Point'] | list[float]]
这表明我们需要一种更深层次的机制来递归地处理嵌套的 Annotated 类型。
解决此问题的关键在于理解类型提示在运行时可以被视为一个树状结构,其中泛型类型(如 list、tuple、Union)是节点,它们的类型参数是子节点。typing 模块提供了 get_origin 和 get_args 函数,用于在运行时检查这些类型结构。
我们可以利用这两个函数,编写一个递归函数来遍历整个类型树,并在遇到 Annotated 类型时,将其替换为其第一个参数(即其所注解的实际类型),然后继续递归处理。
from typing import Annotated, get_args, get_origin, Union
def convert_annotated_to_bare_types(type_object: type) -> type:
"""
递归地将类型对象中的所有 typing.Annotated 包装剥离,
还原出纯粹的底层类型结构。
"""
# 获取类型对象的原始类型和类型参数
# 对于 X[Y, Z, ...],get_origin 返回 X,get_args 返回 (Y, Z, ...)
# 对于非泛型或无参数类型,get_origin 返回 None,get_args 返回 ()
origin, args = get_origin(type_object), get_args(type_object)
# 基本情况:如果类型没有原始类型(即不是泛型或Annotated),直接返回
if origin is None:
return type_object
# 特殊情况:如果原始类型是 Annotated
if origin is Annotated:
# Annotated[T, metadata] 的第一个参数是其所注解的实际类型 T
bare_type = get_args(type_object)[0]
# 递归处理这个实际类型,以防它内部也包含 Annotated
return convert_annotated_to_bare_types(bare_type)
# 递归情况:如果原始类型是其他泛型(如 list, tuple, Union 等)
# 遍历其所有类型参数,并递归地剥离其中的 Annotated
converted_args = [
convert_annotated_to_bare_types(arg) for arg in args
]
# 使用原始类型和处理后的参数重建泛型类型
# 例如,list[int, str] 将被重建为 list[int, str]
# 对于 Union 类型,需要特殊处理,因为 Union[*args] 语法在 Python 3.9+ 才能直接用,
# 且 Union 的参数如果只有一个,Union 本身会消失。
# 考虑到 Union 在 Python 3.10+ 可以用 `|` 运算符,这里使用 `origin[*converted_args]`
# 是兼容的通用做法,它会自动处理 Union 的特殊情况。
if origin is Union and len(converted_args) == 1:
return converted_args[0] # Union[X] 等同于 X
return origin[*converted_args]
基本情况 (origin is None):
Annotated 类型处理 (origin is Annotated):
其他泛型类型处理 (else 块):
让我们用之前定义的 Points 类型来测试这个函数:
# 定义原始类型
Point3D = Annotated[tuple[float, float, float], "A 3D Point"]
Points = Annotated[list[Point3D | list[float]], "A collection of points"]
# 打印原始类型
print(f"原始类型: {Points}")
# 预期输出: typing.Annotated[list[typing.Annotated[tuple[float, float, float], 'A 3D Point'] | list[float]], 'A collection of points']
# 调用函数剥离注解
bare_points_type = convert_annotated_to_bare_types(Points)
# 打印剥离注解后的类型
print(f"剥离注解后的类型: {bare_points_type}")
# 预期输出: list[tuple[float, float, float] | list[float]]输出结果:
原始类型: typing.Annotated[list[typing.Annotated[tuple[float, float, float], 'A 3D Point'] | list[float]], 'A collection of points'] 剥离注解后的类型: list[tuple[float, float, float] | list[float]]
可以看到,所有嵌套的 Annotated 包装及其元数据都被成功剥离,还原出了我们所需的纯粹类型结构。
通过这种递归遍历的方式,我们可以优雅且高效地从复杂的类型提示中剥离 typing.Annotated 包装,从而获得一个干净、纯粹的类型结构,满足特定场景下的需求,例如在生成文档、进行类型转换或动态代码生成时。
以上就是深度解析:如何在Python中递归剥离typing.Annotated类型注解的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号