如何使用正则表达式精准提取含特定类名的 HTML 标签内容

碧海醫心

发布时间：2026-01-05 15:16:22

256人浏览过

来源于php中文网

原创

如何使用正则表达式精准提取含特定类名的 HTML 标签内容

本文介绍在 php 中使用正则表达式安全、准确地提取 class 属性中包含指定关键词（如 "egg"）的 `` 标签内的文本内容，并提供可直接运行的代码示例与关键注意事项。

在实际 Web 开发中，我们常需从 HTML 片段中提取特定语义的内容，例如仅获取 class 属性中包含 "egg" 的标签所包裹的文本。原始尝试的正则 (?).+?(?=) 存在严重逻辑缺陷：它错误地将 | 视为“或”分支，导致匹配锚点混乱（如匹配到 "|egg|"> 中任意单字符），进而捕获了大量无关字符串。

正确的思路是：定位标签结构本身，再捕获其内部内容。推荐使用以下正则表达式：

/(.+?)<\/span>/

">：匹配属性结束与标签闭合的引号和 >；
(.+?)：核心捕获组，非贪婪匹配标签内任意内容（即目标文本）；
：字面量匹配闭合标签（注意 / 转义）。

✅ 完整 PHP 示例（可直接运行）：

$text = 'I ate a boiled egg and ham. I ate a ham and eggs.';

preg_match_all('/(.+?)<\/span>/', $text, $matches);

// $matches[1] 是第一个捕获组——即所有匹配的标签内容
if (!empty($matches[1])) {
    foreach ($matches[1] as $content) {
        echo trim($content) . "\n";
    }
}
// 输出：
// boiled egg
// ham and eggs

⚠️ 重要注意事项：

剪映专业版

一款全能易用的桌面端剪辑软件

下载

立即学习“前端免费学习笔记（深入）”；

正则不适用于复杂 HTML：若 HTML 存在嵌套、属性换行、注释或非法结构，正则易失效。生产环境强烈建议使用 DOM 解析器（如 DOMDocument + XPath）；
避免过度贪婪：务必使用 .*?（非贪婪）而非 .*，否则可能跨标签匹配；
转义字符：在 PHP 字符串中，的 / 需转义为，或改用其他分隔符（如 #(.*?)#）；
编码与特殊字符：若内容含 HTML 实体（如 &），需额外调用 html_entity_decode() 处理；
性能考量：对超长文本频繁执行正则可能影响性能，建议结合缓存或预处理。

总结：该正则方案简洁高效，适用于结构清晰、可控的 HTML 片段提取场景。牢记“正则处理 HTML 有风险”，简单需求可快速落地，复杂场景请转向专业解析器。

C++ 中实现 PHP pack(‘H’) 功能的等效方法

如何在 JSON 请求体中传递文件数据以供 PHP REST 接口接收

如何为歌词文本中的每行自动添加递增序号

如何在 PHP 中安全解析并结构化输出 JSON 数据

如何为歌词段落中的每行标签前自动添加递增序号

HTML速学教程(入门课程)

HTML怎么学习？HTML怎么入门？HTML在哪学？HTML怎么学才快？不用担心，这里为大家提供了HTML速学教程(入门课程)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

php html 正则表达式编码 php 正则表达式 html 字符串 class dom

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：WooCommerce 中强制未登录用户重定向至登录页的正确实现方法下一篇：如何安全实现“记住我”功能：防止Cookie被恶意篡改的完整实践指南

作者最新文章

如何在网页中随机显示一个元素

2026-01-04 12:45

Browserify 项目中事件监听失效与全局函数不可见问题详解

2026-01-04 12:56

Agent 智能客服系统 tgo.ai 正式发布

2026-01-04 13:10

IntelliJ IDEA 无法检测 JDK 的解决方法

2026-01-04 13:10

AI永远涨台积电市值1.6万亿美元全球第六：半导体行业仅次于NVIDIA

2026-01-04 13:24

如何在 Go 中将嵌套结构体正确序列化为 JSON

2026-01-04 13:25

PHP网站登录状态验证：Session与认证Cookie的安全实践

2026-01-04 13:38

伊津野英昭透露工作进展新作正在开发中

2026-01-04 13:40

《使命召唤：黑色行动7》5折也难救！昔日FPS王者不敌竞品

2026-01-04 13:43

TypeScript 类型守卫：优雅处理布尔值与错误对象的联合类型

2026-01-04 13:43

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

php文件怎么打开

打开php文件步骤：1、选择文本编辑器；2、在选择的文本编辑器中，创建一个新的文件，并将其保存为.php文件；3、在创建的PHP文件中，编写PHP代码；4、要在本地计算机上运行PHP文件，需要设置一个服务器环境；5、安装服务器环境后，需要将PHP文件放入服务器目录中；6、一旦将PHP文件放入服务器目录中，就可以通过浏览器来运行它。

2212

2023.09.01