PHP正则表达式怎么用_PHP正则表达式使用与实例讲解

爱谁谁

发布时间：2025-09-25 20:50:01

866人浏览过

来源于php中文网

原创

PHP正则表达式基于PCRE库，通过preg_match、preg_replace等函数实现字符串查找、替换和分割。其核心是模式匹配，使用元字符（如.、\d、^、$）和修饰符（如i、m、s、u）构建规则，支持捕获组、非贪婪匹配及多字节处理。常见陷阱包括灾难性回溯、未转义特殊字符和忽略UTF-8编码问题，优化建议有避免嵌套量词、使用非捕获组(?:...)、锚定位置及预过滤数据，以提升性能与准确性。

php正则表达式怎么用_php正则表达式使用与实例讲解

PHP正则表达式的核心在于通过特定的模式匹配字符串，它提供了一系列以preg_开头的函数，如preg_match用于查找，preg_replace用于替换，让开发者能以强大且灵活的方式处理文本数据。这套机制基于PCRE（Perl Compatible Regular Expressions）库，所以语法上与Perl的正则表达式高度兼容，是处理复杂字符串逻辑的利器。

要说PHP正则表达式怎么用，其实就是围绕着几个核心函数展开。你得先写好一个“模式”（pattern），这模式就是一串描述你想要匹配的文本规则的字符串，然后把这个模式和你要处理的字符串作为参数传给preg_match、preg_replace之类的函数。举个最简单的例子，如果你想检查一个字符串里有没有数字，你的模式可能是/\d+/，然后用preg_match去匹配。我个人觉得，理解正则表达式最关键的就是理解这个“模式”的写法，它就像一种微型编程语言，用符号来表达复杂的文本结构。

PHP正则表达式的基石：常用函数与基础模式

说起PHP里用正则表达式，那几个preg_开头的函数是绕不开的。我刚开始接触的时候，觉得这些函数名有点绕，但用多了就发现它们功能明确，分工也很清晰。

preg_match(pattern, subject, [matches], [flags], [offset])：这个函数是用来执行一次匹配的。它会尝试在subject字符串中查找pattern。如果找到了，就返回1，没找到返回0。matches参数是个数组，如果传入了，它会存储所有匹配到的内容，包括完整的匹配和捕获组的内容。这在我们需要提取特定信息的时候非常有用。

立即学习“PHP免费学习笔记（深入）”；

preg_match_all(pattern, subject, matches, [flags], [offset])：跟preg_match类似，但它会找出所有非重叠的匹配项。matches数组的结构会根据flags参数有所不同，PREG_SET_ORDER会把每个完整匹配作为一个元素，里面再包含捕获组；而PREG_PATTERN_ORDER则会把所有捕获组1的匹配放在一个数组，所有捕获组2的匹配放在另一个数组。我个人更喜欢用PREG_SET_ORDER，觉得逻辑上更直观。

preg_replace(pattern, replacement, subject, [limit], [count])：这个函数用于替换匹配到的内容。它会在subject中查找pattern，然后把所有匹配到的部分替换成replacement字符串。replacement里可以使用反向引用（如$1、\1）来引用pattern中捕获组的内容，这让替换操作变得非常灵活。比如，把所有YYYY-MM-DD格式的日期改成DD/MM/YYYY。

preg_split(pattern, subject, [limit], [flags])：顾名思义，它是用来分割字符串的，但不是用固定的字符串作为分隔符，而是用正则表达式模式。这在需要根据多种复杂分隔符来拆分字符串时特别好用。

preg_grep(pattern, input)：这个函数则有点像数组过滤。它会遍历input数组中的每个元素，只返回那些匹配pattern的元素。

理解了这些函数，剩下的就是模式本身了。一个模式通常用斜杠/包裹起来，比如/hello/。斜杠后面可以跟一些修饰符，比如/hello/i表示不区分大小写匹配。

上面的例子展示了几个基本操作，但正则表达式的威力远不止于此。

PHP正则表达式中常用的元字符和修饰符有哪些？

要真正玩转正则表达式，就得深入了解那些奇奇怪怪的符号，也就是所谓的元字符（Metacharacters）和修饰符（Modifiers）。这些东西刚开始看会觉得眼花缭乱，但它们是构建复杂匹配模式的基石。

元字符： 这些符号在正则表达式中有特殊含义，而不是它们字面上的字符。

.：匹配除换行符以外的任何单个字符。这是最常用的通配符，但有时候也容易过度匹配。
\d：匹配任何数字字符（等价于[0-9]）。
\D：匹配任何非数字字符（等价于[^0-9]）。
\w：匹配任何单词字符（字母、数字或下划线，等价于[a-zA-Z0-9_]）。
\W：匹配任何非单词字符（等价于[^a-zA-Z0-9_]）。
\s：匹配任何空白字符（空格、制表符、换行符等）。
\S：匹配任何非空白字符。
^：匹配字符串的开头。
$：匹配字符串的结尾。
*：匹配前一个字符零次或多次。比如a*能匹配空字符串、a、aa等等。
+：匹配前一个字符一次或多次。a+至少匹配一个a。
?：匹配前一个字符零次或一次。同时它也可以用来使量词变成非贪婪模式（*?、+?、??）。
{n}：匹配前一个字符恰好n次。
{n,}：匹配前一个字符至少n次。
{n,m}：匹配前一个字符至少n次，但不超过m次。
[]：字符集。匹配方括号中的任何一个字符。比如[aeiou]匹配任何一个小写元音字母。
[^]：否定字符集。匹配不在方括号中的任何一个字符。[^0-9]匹配任何非数字字符。
|：或。匹配管道符左右的任何一个模式。cat|dog匹配cat或dog。
()：捕获组。将括号内的模式作为一个整体进行匹配，并且可以捕获匹配到的内容。也可以用来改变操作符的优先级。
\：转义字符。如果想匹配一个元字符本身，比如想匹配.而不是任何字符，你就得用\.。

修饰符（Flags）： 这些是放在正则表达式模式末尾的单个字母，用来改变匹配行为。

i (PCRE_CASELESS)：不区分大小写匹配。/test/i会匹配test、Test、TEST。
m (PCRE_MULTILINE)：多行模式。^和$会匹配每行的开头和结尾，而不仅仅是整个字符串的开头和结尾。
s (PCRE_DOTALL)：点号（.）匹配所有字符，包括换行符。如果没有s修饰符，.不匹配换行符。
U (PCRE_UNGREEDY)：非贪婪模式。默认情况下，量词（*、+、?、{}）是贪婪的，会尽可能多地匹配。U修饰符会让它们变成非贪婪，尽可能少地匹配。这在解析HTML/XML标签时特别有用，比如/<.>/。
u (PCRE_UTF8)：开启UTF-8模式。处理多字节字符（如中文）时非常重要，否则\w等可能会出现意想不到的结果。

我个人在使用时，i、m、s、U、u这几个是最常用的。尤其是在处理用户输入或者解析网页内容时，对大小写、多行、换行符以及贪婪模式的控制，直接决定了匹配结果的准确性。忘记u修饰符处理中文时，那简直是噩梦。

如何在PHP中实现字符串的查找、替换和分割操作？

在PHP中，字符串的查找、替换和分割是正则表达式最常见的应用场景。虽然PHP提供了strpos、str_replace、explode这些函数来处理简单的字符串操作，但一旦涉及到模式匹配，preg_系列函数就显得不可替代了。

查找（Find）：preg_match和preg_match_all是查找的主力。如果你只需要知道一个字符串中是否存在某个模式，或者只需要获取第一次匹配到的内容，preg_match就够了。

这是一个粗体的文本。
这是另一个粗体。";

// 查找第一个粗体标签内的内容
if (preg_match("/(.*?)<\/b>/", $html, $matches)) {
    echo "第一次匹配到的粗体内容: " . $matches[1] . "\n"; // $matches[0]是完整匹配，[1]是第一个捕获组
}
// 输出: 第一次匹配到的粗体内容: 粗体
?>

如果需要找到所有匹配项，那preg_match_all就是你的朋友。

这是一个粗体的文本。
这是另一个粗体。";

// 查找所有粗体标签内的内容
preg_match_all("/(.*?)<\/b>/", $html, $matches_all, PREG_SET_ORDER);
foreach ($matches_all as $match) {
    echo "找到粗体内容: " . $match[1] . "\n";
}
// 输出:
// 找到粗体内容: 粗体
// 找到粗体内容: 粗体
?>

这里PREG_SET_ORDER让$matches_all的每个元素都是一个完整的匹配数组，方便遍历。

LongCat AI
美团推出的AI对话问答工具

下载

替换（Replace）：preg_replace是替换操作的核心。它不仅能替换固定字符串，还能根据模式动态替换，甚至利用反向引用重新组织字符串。
在第二个例子中，$3/$2/$1就是反向引用，它引用了模式中第三、第二和第一个捕获组的内容。这种能力是str_replace无法比拟的。

分割（Split）：preg_split允许你用复杂的模式来分割字符串，而不仅仅是单一的字符或字符串。
姓名:张三 [1] => 年龄:30 [2] => 性别:男 [3] => 城市:北京 ) */ $sentence = "Hello world! How are you?"; // 以一个或多个空格、感叹号分割，并保留分隔符 $words_with_delimiters = preg_split("/(\s+|!)/", $sentence, -1, PREG_SPLIT_DELIM_CAPTURE | PREG_SPLIT_NO_EMPTY); print_r($words_with_delimiters); /* 输出: Array ( [0] => Hello [1] => [2] => world [3] => ! [4] => [5] => How [6] => [7] => are [8] => [9] => you ) */ ?>
PREG_SPLIT_DELIM_CAPTURE这个标志位特别有意思，它能让分隔符本身也作为结果数组的一部分被捕获进来。PREG_SPLIT_NO_EMPTY则会过滤掉空字符串。这种细粒度的控制在处理一些非标准格式数据时非常有用。

PHP正则表达式在使用时有哪些常见陷阱和性能优化建议？

正则表达式虽然强大，但它也是一把双刃剑。不恰当的使用不仅可能导致错误的结果，还可能引发严重的性能问题，甚至让你的服务器CPU飙升。我曾经就被一个看似简单的正则搞得焦头烂额，才意识到这些陷阱有多深。

常见陷阱：

灾难性回溯（Catastrophic Backtracking）： 这是最致命的性能问题之一。当你的正则表达式包含嵌套的量词，并且这些量词可以匹配相同的内容时，就可能发生。例如，^(a+)+b$匹配aaaaab，在匹配失败时（比如aaaaac），引擎会尝试所有可能的a组合，导致指数级的回溯。

例子： /^(a+)+b$/ 匹配 aaaaac 就会很慢。

避免： 尽量避免嵌套的、重复的量词，尤其是当它们能够匹配相同内容时。可以使用原子组(?>...)来防止回溯。

贪婪与非贪婪模式的误解： 默认情况下，量词（*, +, {n,m}）是贪婪的，会尽可能多地匹配。但有时候你需要的是非贪婪匹配，比如解析HTML标签时，/<.>/会匹配从第一个到最后一个>的所有内容，而不是单个标签。

解决： 在量词后面加上?使其变为非贪婪，例如.*?。或者使用U修饰符使整个模式非贪婪。

忘记转义特殊字符： 如果你的模式中需要匹配.、*、+、?、[、]、(、)、{、}、^、$、|、\这些元字符本身，而不是它们的特殊含义，你必须用\进行转义。

例子： 匹配www.example.com，模式应该是/\www\.example\.com/，而不是/www.example.com/。

编码问题（UTF-8）： 在处理包含多字节字符（如中文）的字符串时，如果忘记添加u修饰符（PCRE_UTF8），\w、\s、.等元字符可能会产生错误的结果，或者匹配失败。

解决： 始终在模式末尾加上u修饰符，例如preg_match('/[\x{4e00}-\x{9fa5}]+/u', $text)。

不检查错误： preg_系列函数在匹配失败或模式无效时，会返回false或0，并可能发出警告。但更重要的是，preg_last_error()函数可以提供更详细的错误信息，这对于调试非常关键。

建议： 在调用preg_函数后，总要检查preg_last_error()，尤其是在开发阶段。

性能优化建议：

模式越简单越好： 复杂的模式意味着更多的回溯和计算。如果能用简单的字符串函数（strpos, str_replace, explode）解决，就不要用正则表达式。

避免不必要的捕获组： 捕获组(...)会增加处理开销，因为引擎需要存储匹配到的内容。如果只是想把一部分模式作为一个整体，但不需要捕获其内容，可以使用非捕获组(?:...)。

例子： (?:foo|bar) 比 (foo|bar) 效率略高。

使用更具体的字符类： 尽可能使用\d、\w、\s或具体的字符集[a-zA-Z]，而不是宽泛的.。.需要尝试匹配更多可能性，效率较低。

锚定模式： 如果你知道匹配必须发生在字符串的开头或结尾，使用^和$来锚定模式。这能让引擎更快地确定匹配位置，避免不必要的扫描。

减少回溯： 这是最难但最重要的优化点。除了避免灾难性回溯的模式外，还可以使用原子组(?>...)来阻止引擎在某些部分进行回溯。

预过滤： 对于大型字符串，如果正则表达式匹配的模式只占很小一部分，可以先用strpos或strstr快速检查是否存在可能匹配的子字符串。如果不存在，就完全不需要运行正则表达式。

a+)b$/'; $subject = str_repeat('a', 25) . 'c'; if (preg_match($pattern_optimized, $subject)) { echo "匹配成功\n"; } else { echo "匹配失败 (优化后的模式)\n"; // 匹配失败，但不会回溯很久 } // 非捕获组示例 $text = "apple banana cherry"; preg_match_all("/(?:apple|banana)/", $text, $matches); print_r($matches); // 只需要匹配，不需要捕获组的额外开销 // UTF

相关文章

PHP怎样实现异步任务_实现异步任务的几种思路【方案】

如何在二维平面中高效查找指定半径内的点

PHP怎样生成验证码_生成图形验证码的完整过程【教程】

php远程访问文件怎么打开_php远程文件编码乱码解决法【修复】

PHP怎样发送邮件_通过PHP脚本发送邮件的配置【教程】

PHP速学教程(入门到精通)
PHP怎么学习？PHP怎么入门？PHP在哪学？PHP怎么学才快？不用担心，这里为大家提供了PHP速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

php教程 php word html 正则表达式编码 app 字节编程语言 apple php正则表达式 yy php perl 正则表达式 html strpos count xml 字符串 input 性能优化

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Xdebug 在 VS Code 中停止于不存在的断点：问题诊断与解决方案下一篇：Laravel 批量任务的 finally 回调不执行问题排查与解决

作者最新文章

春运退票后再买算候补吗_退票重购规则解读【答疑】

2026-01-20 09:36

去哪儿网上年货节怎么买酒店年货套餐_去哪儿年货节酒店套餐筛选与退改政策【技巧】

2026-01-20 09:38

通常来说在相同厚度下海冰不如淡水冰坚硬吗神奇海洋1月19日答案

2026-01-20 09:38

NGA玩家社区怎样搜索帖子_NGA精准查找内容与筛选技巧【窍门】

2026-01-20 09:39

HTML怎样设背景图片左右翻转_HTML背景图片翻转设置法【变换】

2026-01-20 09:39

通常来说，大寒节气与以下哪个传统节日在时间上距离更近蚂蚁庄园今日答案1.20

2026-01-20 09:40

语雀怎样设置标签_语雀设标签教程【方法】

2026-01-20 09:44

教育查询网站查询入口教育档案信息查询网页免费

2026-01-20 09:45

荣耀电脑如何批量清理缓存_荣耀电脑批量缓存清理操作技巧【攻略】

2026-01-20 09:47

iphone壳太紧怎么取下来_iphone手机壳过紧取下实用技巧【教程】

2026-01-20 09:47

热门AI工具

更多

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

php文件怎么打开
打开php文件步骤：1、选择文本编辑器；2、在选择的文本编辑器中，创建一个新的文件，并将其保存为.php文件；3、在创建的PHP文件中，编写PHP代码；4、要在本地计算机上运行PHP文件，需要设置一个服务器环境；5、安装服务器环境后，需要将PHP文件放入服务器目录中；6、一旦将PHP文件放入服务器目录中，就可以通过浏览器来运行它。

2707

2023.09.01

php怎么取出数组的前几个元素
取出php数组的前几个元素的方法有使用array_slice()函数、使用array_splice()函数、使用循环遍历、使用array_slice()函数和array_values()函数等。本专题为大家提供php数组相关的文章、下载、课程内容，供大家免费下载体验。

1668

2023.10.11

php反序列化失败怎么办
php反序列化失败的解决办法检查序列化数据。检查类定义、检查错误日志、更新PHP版本和应用安全措施等。本专题为大家提供php反序列化相关的文章、下载、课程内容，供大家免费下载体验。

1527

2023.10.11

php怎么连接mssql数据库
连接方法：1、通过mssql_系列函数；2、通过sqlsrv_系列函数；3、通过odbc方式连接；4、通过PDO方式；5、通过COM方式连接。想了解php怎么连接mssql数据库的详细内容，可以访问下面的文章。

974

2023.10.23

php连接mssql数据库的方法
php连接mssql数据库的方法有使用PHP的MSSQL扩展、使用PDO等。想了解更多php连接mssql数据库相关内容，可以阅读本专题下面的文章。

1444

2023.10.23

html怎么上传
html通过使用HTML表单、JavaScript和PHP上传。更多关于html的问题详细请看本专题下面的文章。php中文网欢迎大家前来学习。

1235

2023.11.03

PHP出现乱码怎么解决
PHP出现乱码可以通过修改PHP文件头部的字符编码设置、检查PHP文件的编码格式、检查数据库连接设置和检查HTML页面的字符编码设置来解决。更多关于php乱码的问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

1529

2023.11.09

php文件怎么在手机上打开
php文件在手机上打开需要在手机上搭建一个能够运行php的服务器环境，并将php文件上传到服务器上。再在手机上的浏览器中输入服务器的IP地址或域名，加上php文件的路径，即可打开php文件并查看其内容。更多关于php相关问题，详情请看本专题下面的文章。php中文网欢迎大家前来学习。

1307

2023.11.13

Python GraphQL API 开发实战
本专题系统讲解 Python 在 GraphQL API 开发中的实际应用，涵盖 GraphQL 基础概念、Schema 设计、Query 与 Mutation 实现、权限控制、分页与性能优化，以及与现有 REST 服务和数据库的整合方式。通过完整示例，帮助学习者掌握使用 Python 构建高扩展性、前后端协作友好的 GraphQL 接口服务，适用于中大型应用与复杂数据查询场景。

1

2026.01.21

热门下载

更多

网站特效
/
网站源码
/
网站素材
/
前端模板

[图片特效]千千静听首页jQuery幻灯片

[表单按钮]jQuery文字选项问卷调查表单提交

[图片特效]jQuery分层轮播3d旋转切换代码

[表单按钮]jquery蓝色下拉搜索框

[图片特效]仿淘宝首页jquery焦点图

[表单按钮]HTML5+CSS3+jQ注册表单 HTML5+CSS3+jQuery注册表单代码下载

[图片特效]jQuery图片绘制动态过程插件imagedrawer

[表单按钮]Login Form登陆框 Login Form登陆框网页特效

[图片特效]css3网页加载后图片翻转效果代码

[表单按钮]CSS学生入学毕业档案表单样式代码

[电商源码]openaishop

[其它模板]思翔企(事)业单位文件柜 build 20080313

[企业站源码]雅龙智能装备工业设备类WordPress主题1.0

[电商源码]威发卡自动发卡系统

[电商源码]卡密分发系统

[电商源码]中华陶瓷网

[电商源码]简洁粉色食品公司网站

[电商源码]极速网店系统

[电商源码]淘宝妈妈_淘客推广系统

[电商源码]积客B2SCMS商城系统

[网站素材]橙色复古户外探险卡片矢量模板

[网站素材]小清新情人节海报传单模板PSD下载

[网站素材]复古户外探险森林黑熊矢量素材

[网站素材]2026新春马年极简线条矢量素材

[网站素材]莫兰迪色块抽象女性矢量插画

[网站素材]国潮新春红灯笼海浪矢量素材

[网站素材]黑金奢华星空山脉背景矢量素材

[网站素材]手绘治愈系猫咪海报矢量素材

[网站素材]2026好柿发生创意便签矢量素材

[网站素材]弥散风商务名片PSD模板下载

[前端模板]驾照考试驾校HTML5网站模板

[前端模板]驾照培训服务机构宣传网站模板

[前端模板]HTML5房地产公司宣传网站模板

[前端模板]新鲜有机肉类宣传网站模板

[前端模板]响应式天气预报宣传网站模板

[前端模板]房屋建筑维修公司网站CSS模板

[前端模板]响应式志愿者服务网站模板

[前端模板]创意T恤打印店网站HTML5模板

[前端模板]网页开发岗位简历作品展示网页模板

[前端模板]响应式人力资源机构宣传网站模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐
/
热门推荐
/
最新课程

最新Python教程从入门到精通

共4课时 | 8.6万人学习

Node.js 教程

共57课时 | 9万人学习

CSS3 教程

共18课时 | 4.7万人学习

JavaScript ES5基础线上课程教学

共6课时 | 9万人学习

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

共79课时 | 151.4万人学习

phpStudy极速入门视频教程

共6课时 | 53.4万人学习

最新Python教程从入门到精通

共4课时 | 9.5万人学习

JavaScript ES5基础线上课程教学

共6课时 | 9万人学习

PHP新手语法线上课程教学

共13课时 | 0.9万人学习

最新文章

更多

如何在数据库中按优先级分批扣减库存（支持跨多条记录的原子化扣减）

Laravel 8 多语言 JSON 本地化失效的正确实现方案

Vue-Laravel 文件上传 FormData 为空问题的完整解决方案

Vue-Laravel 文件上传失败：FormData 为空的完整解决方案

如何在 WordPress 的 iframe 中正确渲染 PHP 短代码

如何将 JSON 对象转换为 PHP 关联数组并安全访问数据

Laravel 8 多语言切换：正确使用 JSON 语言文件与会话持久化

在 PHP 中嵌入 JavaScript 并正确传递 PHP 变量值的完整指南

MySQL 中 EXISTS 子查询在 PHP mysqli 中的正确使用方法

如何在 PHP 中通过关联查询显示外键对应的名称值（而非 ID）