Python正则表达式完全指南 Python正则匹配规则详解

穿越時空

发布时间：2025-06-09 21:36:06

981人浏览过

来源于php中文网

原创

正则表达式是python中处理文本的强大工具，通过re模块实现字符串匹配、查找和替换。基本字符匹配如a只匹配字母a，而元字符如.匹配任意字符，\d匹配数字，\w匹配单词字符，\s匹配空白符，若需匹配元字符本身则使用转义，例如用.匹配点号。例如，手机号可表示为r'\d{11}'。分组用()实现，如r'(\d{4})-(\d{2})-(\d{2})'提取年月日，也可命名分组如(?p\d{4})以便通过名字访问。使用建议包括：贪婪模式默认尽可能多匹配，可用?变为非贪婪；锚点^和$确保整体匹配；多行匹配需加re.dotall标志使.包含换行；常用函数有re.match()从开头匹配，re.search()查找首个匹配，re.findall()获取所有结果，re.sub()用于替换。掌握这些能显著提升数据清洗与分析效率。

Python正则表达式完全指南 Python正则匹配规则详解

正则表达式是处理文本的强大工具，尤其在Python中，通过re模块可以灵活地进行字符串匹配、查找和替换。掌握它的基本规则和用法，能极大提升数据清洗、日志分析等任务的效率。

匹配基础：字符与元字符

正则最基础的是字符匹配，比如写一个a就只会匹配字母a。但真正有用的是元字符，它们有特殊含义。例如：

. 匹配任意单个字符（除了换行符）
\d 匹配数字，等价于[0-9]
\w 匹配单词字符，包括字母、数字和下划线
\s 匹配空白字符，如空格、制表符、换行

如果你要匹配这些元字符本身，比如想查找一个点号.，就需要用\.来转义。

立即学习“Python免费学习笔记（深入）”；

举个例子，想匹配手机号码（假设是11位数字），可以写成：

import re
pattern = r'\d{11}'
text = '我的电话是13812345678'
match = re.search(pattern, text)

这样就能提取出电话号码。

分组与捕获：让结构更清晰

有时候我们不只是要判断是否匹配，还想从中提取特定部分。这时候可以用分组，用小括号()包裹需要的部分。

比如你想从一段文本中提取年月日：

百度智能云·曦灵

百度旗下的AI数字人平台

下载

pattern = r'(\d{4})-(\d{2})-(\d{2})'
text = '日期是 2024-03-15'
match = re.search(pattern, text)
year, month, day = match.groups()

这里每个括号就是一个分组，分别对应年、月、日。你也可以给分组命名，比如：

pattern = r'(?P\d{4})-(?P\d{2})-(?P\d{2})'

这样之后可以通过名字访问：

match.group('year')  # 返回 '2024'

常见陷阱与使用建议

正则虽然强大，但也容易踩坑。以下是一些实用建议：

贪婪 vs 非贪婪：默认情况下，像.*这样的表达式会尽可能多地匹配内容，这可能不是你想要的。可以在后面加个?变成非贪婪模式，例如.*?。
锚点很重要：如果你想确保整个字符串都符合某个模式，而不是其中一部分，记得加上^开头和$结尾。
多行匹配注意换行符：默认.不匹配换行符，如果想让它也匹配，可以加上re.DOTALL标志。
测试正则表达式：可以先用在线工具（如regex101.com）测试你的表达式是否正确，避免反复调试代码。

举个小例子：你想匹配以“hello”开头、以“world”结尾的句子，可以写成：

pattern = r'^hello.*world$'

但如果中间可能有多行，应该加上re.DOTALL：

re.search(pattern, text, re.DOTALL)

总结一下常用函数

Python的re模块有几个常用的函数，用途各有不同：

re.match()：从字符串开头开始匹配，不匹配开头直接返回None
re.search()：扫描整个字符串，找到第一个匹配项
re.findall()：返回所有匹配的结果，适合提取多个值
re.sub()：替换匹配的内容，常用于清理文本

基本上就这些核心功能了，熟练掌握后就可以应对大多数文本处理场景。

如何使用正则表达式在 Pandas 中精准删除特定字符前的分隔符

如何在 Lark 语法中正确区分具有重叠词法形式的语句

如何在 Lark 语法中正确消歧义：分离关键字与正则匹配的终端符号

如何在 Lark 语法中正确消歧义：分离字面量与正则匹配以解决终端冲突

如何基于子字符串匹配实现 Pandas DataFrame 左连接

相关标签:

python 工具 python正则表达式 Python 正则表达式字符串

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python自动化测试框架 Python自动化测试工具如何使用下一篇：如何动态地向类添加方法？

作者最新文章

Win11怎么设置默认压缩和解压工具为7-Zip_Win11上下文菜单关联配置教程【实用】

2026-01-14 18:09

MAC连接Zoom会议麦克风没声音_MAC音频输入设置

2026-01-14 18:09

Win11怎么启用剪贴板图片复制_Win11图文粘贴支持【效率】

2026-01-14 18:41

Win11怎么关闭Windows欢迎体验_Win11首次登录引导界面跳过方法【教程】

2026-01-14 18:43

Win11怎么查看当前系统安全启动状态_Win11UEFI Secure Boot是否启用查询【教程】

2026-01-14 18:47

Win11怎么把“此电脑”图标放到桌面_Win11桌面图标设置【美化】

2026-01-14 18:51

Win11键盘背光不亮怎么办_Win11笔记本键盘灯开启方法【实用】

2026-01-14 18:58

Win11桌面图标间距太大怎么办_Win11注册表调整图标布局方法【指南】

2026-01-14 18:59

Win11怎么查看当前系统是否启用虚拟化_Win11任务管理器或systeminfo命令查询【指南】

2026-01-14 19:03

怎么查询车辆出险记录二手车事故历史自查教程【教程】

2026-01-14 19:07

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

751

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

636

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

758

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

618

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1262

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

706

2023.08.11