微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

最近更新

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 后端开发 > php教程 > 正文

连续的分页采集问题

php中文网

发布： 2016-06-06 20:38:28

原创

1512人浏览过

目标站点：http://news.xinhuanet.com/photo/2015-01/29/c_127433852.htm
获取内容：正文图片和文字说明；
本人实现方法：
因为分页地址是连续的，我是在目标地址上做循环

http://news.xinhuanet.com/photo/2015-01/29/c_127433852_2.htm

用get_headers访问后获取返回是否为200，是的话进行内容抓取
1、curl获取当前地址html后，截取所需内容
2、_2这个就是变量，自增后继续判断下一页是否可以访问，可以访问就继续采集

以上是可以实现采集抓取的，但是好像速度很慢，而且每次都是curl去抓取对服务器貌似也有压力

东盟商机最新AC版As2007 SP1

东盟商机最新AC版As2007 SP1

AS系统本次的主要更新和新开发的功能如下（暂不详述）： 1、修复了普及版的一些大大小小的BUG 2、重新规划整个后台，使后台更加个性化、智能化、更加易用 3、重写了广告部分模块，使其更加专业化 4、重写了文章采集模块，添加了定时自动采集功能 5、添加了供求信息采集功能 6、重写了友情连接功能（原来的太简单了） 8、重写了生成HTML模块。（几个主要模块首页不用原来的生成方式，不再会被卡巴斯机杀毒软

东盟商机最新AC版As2007 SP1

0

东盟商机最新AC版As2007 SP1

问题：如何改进，大家是如何用php做的抓取，求思路和方向

回复内容：

目标站点：http://news.xinhuanet.com/photo/2015-01/29/c_127433852.htm
获取内容：正文图片和文字说明；
本人实现方法：
因为分页地址是连续的，我是在目标地址上做循环

http://news.xinhuanet.com/photo/2015-01/29/c_127433852_2.htm

用get_headers访问后获取返回是否为200，是的话进行内容抓取
1、curl获取当前地址html后，截取所需内容
2、_2这个就是变量，自增后继续判断下一页是否可以访问，可以访问就继续采集

以上是可以实现采集抓取的，但是好像速度很慢，而且每次都是curl去抓取对服务器貌似也有压力

问题：如何改进，大家是如何用php做的抓取，求思路和方向

下面不是有分页么，直接获取<div id="div_currpage"></div>里面的链接存到数组抓吧

直接抓取，抓取返回结果的时候就先判断状态码是否为200
Curl并发

相关标签：

php

大家都在看：

php网页源码怎么安装_php网页源码安装配置与运行法【指南】 php不能生成图片的解决办法 php源码怎么看颜色_用编辑器查看PHP源码语法高亮教程【技巧】 php中使用rand产生随机数 php架构什么意思

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：微信小程序出现“invalid code”怎么办下一篇：百度编辑器Ueditor如何初始化内容

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

最新问题

怎么扒php源码_用工具抓取PHP网站源码教程【技巧】无法直接获取PHP源码，但可通过抓取前端代码、分析网络请求、探测泄露文件、逆向API接口及调试技术间接分析。1.用HTTrack等工具下载网站静态资源；2.浏览器开发者工具查看Network和Sources，分析XHR请求与JS逻辑；3.尝试访问index.php.bak等备份文件，使用Gobuster扫描敏感目录；4.在Postman中重放API请求，通过参数测试推断后端处理逻辑；5.若有服务器权限，可利用Xdebug远程调试或分析opcode缓存获取解密代码。

2025-12-03 02:39:22

110

怎么找到php源码_php源码定位搜索与检索技巧可通过系统化方法快速定位PHP源码：一、用编辑器全局搜索功能查找关键词；二、使用grep命令递归检索PHP文件；三、通过debug_print_backtrace()逆向追踪调用栈；四、利用IDE符号跳转与引用查找功能；五、构建ctags索引实现高效导航。

2025-12-03 02:35:27

910

php怎么显示源码_php源码显示输出与调试查看答案：可通过highlight_string()显示PHP源码，用file_get_contents()和highlight_file()读取外部文件，结合var_dump()与print_r()调试变量，启用error_reporting()查看错误，或使用Xdebug扩展增强调试。

2025-12-03 02:13:35

524

php源码怎么更改_用编辑器修改PHP源码内容教程【技巧】答案：修改PHP源码需选用专业编辑器并配置语言支持，定位目标文件后备份再编辑；通过搜索关键字修改变量或函数逻辑，添加新代码时注意命名规范与位置；最后保存更改并验证页面运行状态，检查错误日志确保语法正确。

2025-12-03 01:51:15

118

php中PDO获取关联数组使用PDO获取关联数组需设置模式为PDO::FETCH_ASSOC，执行查询时通过fetch()或fetchAll()返回字段名键数组，预处理语句同样适用，亦可全局设置ATTR_DEFAULT_FETCH_MODE属性使所有结果默认为关联数组。

2025-12-02 19:57:06

312

怎么自己制作PHP加解密算法_用PHP实现自定义加解密算法教程【技巧】可通过异或运算实现简单加解密，逐字符与密钥异或并编码输出，适用于低敏感场景；2.混合加密结合移位与替换表，增加破解难度，支持动态映射提升随机性；3.推荐使用OpenSSL扩展调用AES-256-CBC等标准算法，配合安全密钥和IV实现高安全性加密；4.自定义多轮加密可组合反转、填充、Base64编码与异或操作，构建多层防护，解密时逆序处理确保数据还原。

2025-12-02 19:56:02

265

php直播源码怎么打开_php直播源码打开与运行设置【技巧】首先确认服务器环境满足PHP7.0以上并启用curl、mysqli、redis扩展，检查php.ini配置后重启Web服务；接着将源码上传至网站根目录并解压，设置正确文件权限；然后编辑config目录下的数据库配置文件，填入正确的数据库信息并导入SQL结构；再配置Apache或Nginx的URL重写规则以确保请求正确路由至index.php；最后若需实时通信功能，进入server目录启动基于Swoole或Workerman的WebSocket服务，并开放对应端口。

2025-12-02 19:56:02

158

php网页源码怎么安装_php网页源码安装配置与运行法【指南】首先搭建PHP运行环境，安装XAMPP并启动Apache和MySQL服务；接着将PHP源码复制到htdocs目录下，通过http://localhost/项目名访问；然后在phpMyAdmin中创建数据库并导入.sql文件，修改配置文件中的数据库连接参数；再根据需要调整php.ini中的上传大小、执行时间等设置，并重启Apache；最后查看浏览器错误提示和日志文件，排查函数缺失、语法错误或权限问题并修复。

2025-12-02 19:55:32

1008

php不能生成图片的解决办法 PHP能生成图片，需确保GD或ImageMagick扩展已启用；通过php.ini开启extension=gd，用phpinfo()验证；输出时设header("Content-type:image/png")且无额外输出；可选ImageMagick替代；保存文件需目录有写权限。

2025-12-02 19:55:02

858

php源码怎么看颜色_用编辑器查看PHP源码语法高亮教程【技巧】使用支持语法高亮的编辑器可解决PHP源码无颜色问题。1、选择VisualStudioCode等编辑器并打开.php文件；2、确保启用PHP语言模式以触发自动高亮；3、通过设置更换深色或浅色主题优化视觉效果；4、可自定义语法元素颜色提升可读性；5、浏览器中可安装“CodeHighlighter”插件实现在线高亮显示。

2025-12-02 19:53:02

462

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部