讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 后端开发 > php教程 > 正文

关于preg_match_all的抓取,该如何解决

php中文网

发布： 2016-06-13 12:55:11

原创

1067人浏览过

关于preg_match_all的抓取

<div><br />
<h1>标题1</h1><br />
<p>内容1</p>
                    <div class="aritcle_card">
                        <a class="aritcle_card_img" href="/ai/1319">
                            <img src="https://img.php.cn/upload/ai_manual/000/000/000/175680201295703.jpg" alt="AI Undetect">
                        </a>
                        <div class="aritcle_card_info">
                            <a href="/ai/1319">AI Undetect</a>
                            <p>让AI无法察觉，让文字更人性化，为文字体验创造无限可能。</p>
                            <div class="">
                                <img src="/static/images/card_xiazai.png" alt="AI Undetect">
                                <span>162</span>
                            </div>
                        </div>
                        <a href="/ai/1319" class="aritcle_card_btn">
                            <span>查看详情</span>
                            <img src="/static/images/cardxiayige-3.png" alt="AI Undetect">
                        </a>
                    </div>
                <br />
<p>内容2</p><br />
<h1>标题2</h1><br />
<p>内容1</p><br />
<p>内容2</p><br />
<p>内容3</p><br />
<p>内容4</p><br />
<h1>标题3</h1><br />
<p>内容1</p><br />
<p>内容2</p><br />
<p>内容3</p><br />
</div>

登录后复制

我要用preg_match_all()来循环获取从

到下一个

之前的内容即

标题1

内容1

内容2

－－－－－－－－－－－－

标题2

内容1

内容2

内容3

内容4

－－－－－－－－－－－－

标题3

内容1

内容2

内容3

我想过用

preg_match_all('/<h1>[\w\W]*<(h1|\/div)/U',$html, $out)

登录后复制

但这样抓，会隔一个就跳过，因为第二个的

已经被第一个用了。

------解决方案--------------------

preg_match_all('/<div>(.*)<\/div>/is', $str, $m);<br />
$m = explode('<h1>', substr($m[1][0], 5));<br />
foreach($m as $x)<br />
    echo htmlspecialchars ("<h1>$x") . '<br/>';

登录后复制

大家都在看：

php代码怎么变红色 html里如何加入php js 如何嵌入php代码 php中有哪些标签 < php >包含哪些内容

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇： CURL中文乱码解决方案下一篇：软件工程师2013新年增值计划，转自php100

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

最新问题

php怎么在ajax请求返回数组字符串_php ajax请求返回数组转json字符串方法【技巧】 PHP处理AJAX请求必须用json_encode()转数组为JSON字符串并设Content-Type头，推荐封装jsonResponse()函数统一响应，注意中文编码、空格等特殊字符处理及JSON有效性校验。

2025-12-17 22:40:56

448

php怎么取字符串里的数组_php字符串取数组json_decode与正则匹配法【技巧】需根据字符串格式选择对应方法：一、标准JSON用json_decode；二、嵌套在非JSON中用正则提取后解析；三、PHP数组语法先替换再解析；四、可信环境可用eval；五、序列化字符串用unserialize。

2025-12-17 22:40:02

287

怎么修改php源码_php修改源码功能与结构调整法【教程】修改PHP源码需先明确答案，再通过直接编辑文件、分离配置、重构函数类结构、使用预处理器指令、引入命名空间与自动加载、结合版本控制等方法优化代码逻辑与结构，提升可维护性与扩展性。

2025-12-17 22:39:34

102

PHP中define定义常量的方法 define()用于定义不可修改的全局常量，语法为define(name,value,case_insensitive)，支持标量及PHP7.0+数组类型，不区分大小写需显式设置第三参数为true，且须用defined()检查是否已定义。

2025-12-17 22:39:24

934

php怎么分割一个字符串数组_php字符串数组分割技巧【步骤】按规则分割字符串数组有五种方法：一、array_chunk按固定数量分组；二、array_slice配合循环动态截取；三、preg_split用正则拆分单字符串；四、explode嵌套处理多级分隔符；五、array_filter依条件筛选重组。

2025-12-17 22:37:25

716

PHP构建简单留言板教程_PHP与MySQL实现留言功能用PHP和MySQL实现留言板需三步：建表（含id、nickname、content、created_at字段）、PHP用PDO预处理防SQL注入并htmlspecialchars过滤XSS、前端表单提交+后端查询倒序展示，辅以长度限制与空值校验。

2025-12-17 22:37:02

527

php返回数组拆分操作_php分割数组成小数组方法【教程】 PHP数组分段可通过array_chunk()函数、for循环+array_slice()、array_keys()+array_values()组合、array_combine()配合键值分离，以及递归函数处理多维数组五种方法实现。

2025-12-17 22:37:02

405

php怎么对一个数组加大括号_php数组加大括号技巧【教程】 PHP中为数组元素添加大括号有五种方法：一、array_map配匿名函数；二、foreach引用原地修改；三、implode+str_replace（限纯字符串）；四、sprintf配array_walk；五、preg_replace_callback处理复杂内容。

2025-12-17 22:36:08

128

php查找数组不重复字段_php数组唯一值查找技巧【指南】 PHP数组去重有五种方法：一、array_unique()函数直接移除重复值；二、array_flip()两次反转法利用键唯一性；三、手动遍历+in_array()自定义逻辑；四、array_reduce()函数式累积构建；五、多维数组需先序列化再去重。

2025-12-17 22:35:52

346

php怎么用拼接字符串数组_PHP拼接字符串与数组 PHP中拼接字符串与数组有五种方法：一、用implode()以分隔符连接数组元素；二、用点运算符逐个拼接指定元素；三、用foreach循环灵活构建；四、用sprintf()配合解包按模板格式化；五、用array_reduce()自定义逻辑归约。

2025-12-17 22:34:38

747

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部