Python分组与捕获用法详解_复杂模式匹配解析【教学】-Python教程-PHP中文网

Python分组与捕获用法详解_复杂模式匹配解析【教学】

冰川箭仙

发布： 2025-12-23 13:02:02

原创

371人浏览过

Python正则分组核心是用()定义可提取、复用、命名的子表达式，包括基础捕获组、非捕获组(?:...)、反向引用\1、命名组(?P...)及嵌套组合，支撑文本解析与高级替换。

python分组与捕获用法详解_复杂模式匹配解析【教学】

Python 中的正则表达式分组与捕获，核心在于用圆括号 () 定义子表达式，让匹配结果可提取、可复用、可命名。它不只是“把内容括起来”，而是控制匹配逻辑、组织返回结构、支撑高级替换的关键机制。

默认情况下，每个 () 构成一个捕获组，re.search 或 re.findall 会按组顺序返回匹配内容。

re.search(r'(\d{4})-(\d{2})-(\d{2})', '2023-12-25') 返回三个组：'2023'、'12'、'25'
re.findall(r'(\w+)=(\d+)', 'a=1,b=2,c=3') 返回列表：[('a','1'), ('b','2'), ('c','3')]，每项是元组
非捕获组 (?:...) 不保存结果，只用于逻辑分组，比如 r'(?:https?://)?(\w+\.\w+)' 只捕获域名

用 \1、\2 等引用前面第 n 个捕获组的**实际匹配文本**，常用于检测重复、配对或格式一致性。

写成 (?P<name>...)</name>，后续可用 match.group('name') 或 match.groupdict() 获取，避免数序号出错。

剪小映

记录美好智能成片，AI智能视频剪辑

902

re.search(r'(?P<year>\d{4})-(?P<month>\d{2})-(?P<day>\d{2})', '2023-04-01')</day></month></year>
match.group('year') → '2023'；match.groupdict() → {'year':'2023', 'month':'04', 'day':'01'}
命名组也支持反向引用：(?P<tag>\w+)>(.*?)(?P=tag)</tag>，(?P=tag) 表示复用同名组内容

复杂文本（如日志、配置、代码片段）常需多级分组配合量词和分支。关键是理清优先级和边界。

避免过度嵌套：先用非捕获组 (?:...) 组织逻辑，再在外层加命名捕获
结合 | 使用时注意分组范围：r'(cat|dog)s?' 捕获整个单词；r'(cat|dog)(s?)' 分开捕获种类和复数标记
用 re.VERBOSE 写长模式：允许换行、空格和注释，大幅提升可读性，例如解析带单位的数值 r'''(?P<value>\d+(?:\.\d+)?)\s+(?P<unit>kg|g|ml|L)'''</unit></value>

分组与捕获不是炫技工具，而是让正则从“是否匹配”走向“如何理解文本”的桥梁。掌握括号的类型、引用方式和命名习惯，就能稳住大多数解析场景。

以上就是Python分组与捕获用法详解_复杂模式匹配解析【教学】的详细内容，更多请关注php中文网其它相关文章！