微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 后端开发 > php教程 > 正文

处理获取到的大量html数据

php中文网

发布： 2016-06-23 13:47:16

原创

1023人浏览过

获取到一大堆的html数据，大概有3万个字符的大小。但是前面没用的，只有后面几千字符是有用的，想从里面提取数据。如果直接用正则去处理就浪费了很多资源，有没有什么方法可以从字符串的最后面开始正则，然后取到某个地方就停止。
刚刚一开始尝试用simple_html_dom类来处理，但是后来卡住了...
因为每次去到的东西都不一定长短，所以直接截取固定数量的长度的字符这个方法不太好。

图可丽批量抠图

图可丽批量抠图

用AI技术提高数据生产力，让美好事物更容易被发现

图可丽批量抠图

26

图可丽批量抠图

回复讨论(解决方案)

既然你并不能准确的你需要的内容从什么位置开始，那么就不存在资源浪费的问题

获取html
file_get_contents
curl

正则解析html，可以获取想要的文本。

没什么好办法，因为你要过滤数据，要么正则匹配，要么用你用的那个类。

大家都在看：

使用 async/await 解决Ajax异步请求计数不准确问题解决Laravel邮件内容换行符不生效问题：发送HTML格式邮件指南 PHP动态表单多维数据POST提交与文件存储实践 PHP动态内容持久化：从会话到数据库的实践指南 Laravel Excel：解决从数组导出空文件问题并实现数据导出

HTML速学教程(入门课程)

HTML速学教程(入门课程)

HTML怎么学习？HTML怎么入门？HTML在哪学？HTML怎么学才快？不用担心，这里为大家提供了HTML速学教程(入门课程)，有需要的小伙伴保存下载就能学习啦！

来源：php中文网

上一篇：php和mssql 2000插入数据时的错误下一篇：在服务器上面可以安装wampserver吗？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

最新问题

修复 PHP json_encode 输出中斜杠转义的实用指南本教程旨在解决PHPjson_encode函数在处理包含正斜杠（/）的字符串时，将其转义为\/的常见问题。我们将深入探讨这一默认行为的原因，并提供一个简洁高效的解决方案：利用JSON_UNESCAPED_SLASHES选项。通过代码示例，您将学会如何在生成JSON响应时，确保URL或文件路径中的斜杠保持原始状态，提升数据可读性。

2025-11-09 12:04:15

622

解决 Symfony 嵌套表单更新时子实体意外删除问题本教程旨在解决Symfony应用中，当通过多层嵌套的CollectionType表单更新父实体时，深层子实体被意外删除的问题。我们将深入探讨orphanRemoval、by_reference=false与实体remove方法中setParent(null)调用的交互，并提供一个简洁有效的解决方案，确保数据完整性。

2025-11-09 12:02:49

749

WordPress开发：将动态复选框列表转换为多选下拉菜单本教程详细指导WordPress开发者如何将现有动态复选框列表重构为支持多选的下拉菜单。通过利用HTML的和标签，结合PHP循环动态生成选项，文章将展示如何优化用户界面，同时确保正确处理预选状态和表单数据提交。此方法适用于需要节省空间或优化表单交互的场景。

2025-11-09 12:02:23

223

使用 async/await 解决Ajax异步请求计数不准确问题本文深入探讨了在JavaScript中使用Ajax进行数据插入时，由于其异步特性导致计数器无法准确累加的问题。通过引入async/await语法和Promise机制，教程详细演示了如何确保Ajax请求按序执行，从而实现计数器的正确递增，并在所有操作完成后获取最终结果，有效解决了异步操作中的时序挑战。

2025-11-09 12:02:01

358

OpenCart开发：从含税价格中准确计算不含税价格本文旨在解决OpenCart开发中，从已包含税费的价格中正确反向计算出不含税价格的常见难题。我们将探讨直接使用税费计算函数可能导致的错误，并提供一套数学上准确、适用于单一百分比税率及混合税费（百分比与固定税费）场景的计算方法，帮助开发者避免税费计算偏差，确保商品价格的准确性。

2025-11-09 12:00:38

688

解决Laravel邮件内容换行符不生效问题：发送HTML格式邮件指南本教程旨在解决在Laravel应用中发送邮件时，HTML换行符（）不生效的问题。核心在于确保邮件内容以HTML格式发送，而非纯文本。文章将指导您如何利用Laravel的Mailable系统和Blade模板来正确构建和发送包含HTML格式的邮件，确保换行和其他样式能被邮件客户端正确解析和显示。

2025-11-09 11:57:46

873

php storm 怎么用_PHPStorm开发工具配置与PHP开发方法配置PHP解释器、启用Xdebug调试、设置UTF-8编码、集成Composer及数据库连接可解决PhpStorm开发环境问题，提升开发效率。

2025-11-09 11:56:02

251

PHP动态表单多维数据POST提交与文件存储实践本教程旨在解决PHP动态表单中多维数据通过POST方法提交并存储到文件的问题。我们将深入探讨如何正确命名表单输入元素以在PHP中接收为数组，并通过array_chunk等函数重构数据结构，最终实现将收集到的动态数据高效、安全地写入文本文件。文章将提供详细的代码示例和注意事项，帮助开发者构建健壮的动态表单处理逻辑。

2025-11-09 11:55:41

441

ModSecurity特定URI白名单配置教程本教程详细阐述了如何在ModSecurity中为特定URI配置白名单，以解决因应用程序逻辑（如GET参数中的UUID）触发误报的问题。通过创建精确的排除规则，结合REQUEST_FILENAME匹配和ctl:ruleRemoveTargetById指令，可以安全地绕过对指定参数的ModSecurity检查，确保Web应用的正常运行和安全性平衡。

2025-11-09 11:53:01

833

PHP框架怎么实现搜索功能_PHP框架全文搜索与筛选实现使用PHP框架实现搜索功能需根据项目规模选择方案：小型项目可用数据库模糊查询，如Laravel中通过EloquentORM的whereLike进行关键字匹配；为提升效率，可创建MySQLFULLTEXT索引并使用MATCH...AGAINST语法优化全文检索；对于复杂场景，推荐集成Elasticsearch或Meilisearch，并借助LaravelScout实现高性能搜索；多条件筛选可通过动态构建查询链完成，结合分类、价格、时间等参数灵活过滤；前端通过API路由返回JSON数据，利用AJAX

2025-11-09 11:47:13

428

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部