Python re模块核心用法:re.search()扫描全文找首匹配,re.match()仅从开头匹配;re.findall()批量提取,分组影响返回格式;re.sub()支持字符串/函数替换;高频使用需re.compile()预编译提升效率。

Python 的 re 模块是处理文本匹配与提取最常用、最高效的工具之一。掌握它,能帮你快速完成日志解析、数据清洗、网页内容抽取、格式校验等任务。关键不在于背所有语法,而在于理解“模式怎么写、函数怎么选、结果怎么用”。
re.match() 只从字符串开头匹配,re.search() 则扫描整个字符串找第一个符合的位置——大多数时候该用 search。
例如,从一段文字中提取手机号(假设是 11 位数字):
import re
text = "联系我:13812345678,或邮箱 hello@abc.com"
pattern = r"1[3-9]\d{9}" # 匹配以 1 开头、第二位 3-9、共 11 位的数字
match = re.search(pattern, text)
if match:
print(match.group()) # 输出:13812345678
注意:group() 返回匹配到的完整字符串;如果正则里用了括号 (),还能用 group(1)、group(2) 提取子组。
立即学习“Python免费学习笔记(深入)”;
当你需要找出全部匹配项(比如所有邮箱、所有链接、所有价格),findall 是最直接的选择。
re.findall(r"\d+", "a12b34c5") → ["12", "34", "5"]
re.findall(r"(\w+)@(\w+\.\w+)", "a@b.com c@d.org") → [("a", "b.com"), ("c", "d.org")]
re.sub(pattern, repl, string) 能按规则替换文本,支持字符串或函数作为替换值。
re.sub(r"\s+", " ", text)
re.sub(r"(\d{3})\d{4}(\d{4})", r"\1****\2", "13812345678") → "138****5678"
match 对象,根据内容决定替换结果如果同一正则在循环或高频场景中反复使用(比如逐行处理大文件),先用 re.compile() 编译一次,后续调用 search/findall 等方法会更快、更清晰:
phone_pattern = re.compile(r"1[3-9]\d{9}")
for line in log_lines:
match = phone_pattern.search(line)
if match:
print(match.group())
还能给编译后的对象加标志,比如 re.compile(r"abc", re.I) 表示忽略大小写。
以上就是Python正则表达式怎么用_re模块实战教程【教程】的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号