Python正则表达式怎么用_re模块实战教程【教程】-Python教程-PHP中文网

Python正则表达式怎么用_re模块实战教程【教程】

舞夢輝影

发布： 2025-12-20 22:47:57

原创

725人浏览过

Python re模块核心用法：re.search()扫描全文找首匹配，re.match()仅从开头匹配；re.findall()批量提取，分组影响返回格式；re.sub()支持字符串/函数替换；高频使用需re.compile()预编译提升效率。

python正则表达式怎么用_re模块实战教程【教程】

Python 的 re 模块是处理文本匹配与提取最常用、最高效的工具之一。掌握它，能帮你快速完成日志解析、数据清洗、网页内容抽取、格式校验等任务。关键不在于背所有语法，而在于理解“模式怎么写、函数怎么选、结果怎么用”。

基础匹配：用 re.search() 和 re.match() 找第一个匹配

re.match() 只从字符串开头匹配，re.search() 则扫描整个字符串找第一个符合的位置——大多数时候该用 search。

例如，从一段文字中提取手机号（假设是 11 位数字）：

import re
text = "联系我：13812345678，或邮箱 hello@abc.com"
pattern = r"1[3-9]\d{9}"  # 匹配以 1 开头、第二位 3-9、共 11 位的数字
match = re.search(pattern, text)
if match:
    print(match.group())  # 输出：13812345678

登录后复制

注意：group() 返回匹配到的完整字符串；如果正则里用了括号 ()，还能用 group(1)、group(2) 提取子组。

立即学习“Python免费学习笔记（深入）”；

盘古大模型

华为云推出的一系列高性能人工智能大模型

207

查看详情

批量提取：用 re.findall() 拿到所有结果

当你需要找出全部匹配项（比如所有邮箱、所有链接、所有价格），findall 是最直接的选择。

模式无分组时，返回字符串列表，如 re.findall(r"\d+", "a12b34c5") → ["12", "34", "5"]
模式含一个分组时，只返回该分组内容，如 re.findall(r"(\w+)@(\w+\.\w+)", "a@b.com c@d.org") → [("a", "b.com"), ("c", "d.org")]
多个分组时，返回元组列表，每个元组对应一次匹配中的各组内容

安全替换：用 re.sub() 替换匹配内容

re.sub(pattern, repl, string) 能按规则替换文本，支持字符串或函数作为替换值。

简单替换：把所有连续空格换成单个空格 —— re.sub(r"\s+", " ", text)
带逻辑替换：隐藏手机号中间 4 位 —— re.sub(r"(\d{3})\d{4}(\d{4})", r"\1****\2", "13812345678") → "138****5678"
用函数动态处理：传入 match 对象，根据内容决定替换结果

预编译提升效率：用 re.compile() 复用正则对象

如果同一正则在循环或高频场景中反复使用（比如逐行处理大文件），先用 re.compile() 编译一次，后续调用 search/findall 等方法会更快、更清晰：

phone_pattern = re.compile(r"1[3-9]\d{9}")
for line in log_lines:
    match = phone_pattern.search(line)
    if match:
        print(match.group())

登录后复制

还能给编译后的对象加标志，比如 re.compile(r"abc", re.I) 表示忽略大小写。

以上就是Python正则表达式怎么用_re模块实战教程【教程】的详细内容，更多请关注php中文网其它相关文章！

大家都在看：

Python构建预测模型的训练评估与优化完整实践【教学】 Python利用多进程提升海量数据处理效率的通用方案【教程】 Python分析结果如何输出_报表与图表生成方法【教学】 Python迭代器与生成器用法_节省内存技巧说明【教程】 Python深度学习构建端到端语音识别系统的整体流程【教学】