通过php正则提取HTML标签_基于php正则解析HTML内容的方案

蓮花仙者

发布时间：2025-10-02 16:51:02

1010人浏览过

来源于php中文网

原创

正则可快速提取简单HTML标签内容，如用/]*>(.*?)/is匹配段落文本；2. 可扩展支持特定属性，如含class的div；3. 能提取img的src等属性值；4. 但对嵌套、不完整标签易出错，复杂场景应使用DOM解析器。

通过php正则提取html标签_基于php正则解析html内容的方案

在PHP中提取HTML标签内容时，正则表达式是一种轻量级且灵活的方案，适用于结构简单或格式明确的HTML片段。虽然处理复杂HTML文档推荐使用DOM解析器（如DOMDocument），但在某些场景下，用正则快速提取特定标签内容更高效。

1. 匹配基本HTML标签结构

正则的基本模式是匹配起始标签、中间内容和结束标签。以提取

标签为例：

$pattern = '/]*>(.*?)<\/p>/is';
preg_match_all($pattern, $html, $matches);
$content = $matches[1]; // 提取的内容

说明：

]*> 匹配及其可能存在的属性（如class、id）
(.*?) 非贪婪捕获标签内的文本
匹配闭合标签，斜杠转义
修饰符i表示不区分大小写，s使.可匹配换行符

2. 提取带特定属性的标签

若需提取含有特定class或id的标签，可在正则中加入属性匹配：

立即学习“PHP免费学习笔记（深入）”；

SCNet智能助手

SCNet超算互联网平台AI智能助手

下载

$pattern = '/]+class=["\']my-class["\'][^>]*>(.*?)<\/div>/is';
preg_match_all($pattern, $html, $matches);

注意点：

[^>]+ 确保标签内有内容
双引号或单引号都支持：["\']
属性顺序可能变化，避免写死位置

3. 提取标签中的属性值

有时需要提取src、href等属性值，例如获取所有图片的src：

$pattern = '/@@##@@]+src=["\']([^"\']+)["\'][^>]*>/i';
preg_match_all($pattern, $html, $matches);
$srcs = $matches[1];

该正则捕获src属性的值，忽略其他属性顺序。

4. 注意事项与局限性

正则处理HTML存在风险，需注意以下几点：

嵌套标签无法准确匹配，如...，非贪婪模式也可能出错
不完整的HTML（如自闭合标签）可能导致匹配失败
过于复杂的结构建议改用DOMDocument + DOMXPath
性能方面，正则适合小片段，大文档慎用

基本上就这些。对于简单提取任务，PHP正则足够用；若HTML结构复杂或动态多变，转向DOM解析更稳妥。通过php正则提取HTML标签_基于php正则解析HTML内容的方案

PHP怎么用滴滴DiDiAI_传行程信息调模型估路况时间【分享】

php远程访问文件怎么打开_php远程api文件调用读取法【接口】

php远程访问文件怎么打开_phpcurl重试机制访问远程法【重试】

Laravel 9 路由中控制器类不可见的解决方案

PHP如何用顶象AI反欺诈_传行为数据调识别模型断异常【锐法】

HTML速学教程(入门课程)

HTML怎么学习？HTML怎么入门？HTML在哪学？HTML怎么学才快？不用担心，这里为大家提供了HTML速学教程(入门课程)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

php html 正则表达式 php 正则表达式 html class dom href

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：PHP框架性能如何优化_PHP框架性能优化技巧与实践下一篇：使用 Guzzle HTTP 客户端在 Laravel 中发送 JSON 数据

作者最新文章

exel表格怎么清除多个数字的单位_Excel批量去除数字单位技巧

2026-01-13 16:27

uc浏览器如何卸载内置冗余应用_uc浏览器卸载应用途径【整理】

2026-01-13 16:33

HTML5导入iPad图表数据错位咋调_HTML5调iPad图表导入位法【校准】

2026-01-13 16:37

Word目录跳转不到对应页咋调_Word目录定位修法【方法】

2026-01-13 16:38

iPad上HTML5导入语音转文字慢怎快_HTML5快iPad语音导入法【加速】

2026-01-13 16:46

PHP文件名替换怎么弄_替换失败常见原因有哪些【排查】

2026-01-13 16:46

Win11报错0xC000021A怎么修_0xC000021A错误修复法【方案】

2026-01-13 16:53

怎样用ChatPPT对比年度目标与实际成果_ChatPPT对比分析【技巧】

2026-01-13 16:57

tv浏览器怎样限制html5带宽_tv浏览器限带宽技巧【节流】

2026-01-13 17:01

iPad上HTML5导入图片卡顿如何解决_HTML5导入iPad图片提速法【办法】

2026-01-13 17:03

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

php文件怎么打开

打开php文件步骤：1、选择文本编辑器；2、在选择的文本编辑器中，创建一个新的文件，并将其保存为.php文件；3、在创建的PHP文件中，编写PHP代码；4、要在本地计算机上运行PHP文件，需要设置一个服务器环境；5、安装服务器环境后，需要将PHP文件放入服务器目录中；6、一旦将PHP文件放入服务器目录中，就可以通过浏览器来运行它。

2489

2023.09.01