php 网络爬虫

php中文网
发布: 2016-06-23 14:16:52
原创
1225人浏览过

PHP 网络爬虫 数据库 行业数据

有开发过类似程序的高手吗?能够给点指点哦。功能需求是从网站自动获取相关数据,然后存入数据库。

回复讨论(解决方案)

curl爬取目标网站,正则或者DOM获取相应的数据,然后存数据库或者文件。
也没有太难的东西吧。你需要考虑的有:
爬取的策略(只抓取特定域名的,深度优先还是广度优先)。

爬取的效率(可开多线程去爬取,如何分配各个爬虫的任务)

等。。。。。。。。

谢谢,能否推荐些参考资料哈,本人菜鸟,还有待提高,十分感谢。

谢谢,能否推荐些参考资料哈,本人菜鸟,还有待提高,十分感谢。
开源的爬虫很多,phpdig等,如果不限语言,还有很多如java版的nutch(hadoop的前身)。。如果仅仅是简单的数据提取,倒是有一个很简单的client类,snoopy

开源的很多!!!!

想找php源码参考一下


谢谢,能否推荐些参考资料哈,本人菜鸟,还有待提高,十分感谢。
开源的爬虫很多,phpdig等,如果不限语言,还有很多如java版的nutch(hadoop的前身)。。如果仅仅是简单的数据提取,倒是有一个很简单的client类,snoopy
谢谢,我需要的是从网站自动抓取需要的数据,然后存入数据库。



谢谢,能否推荐些参考资料哈,本人菜鸟,还有待提高,十分感谢。
开源的爬虫很多,phpdig等,如果不限语言,还有很多如java版的nutch(hadoop的前身)。。如果仅仅是简单的数据提取,倒是有一个很简单的client类,snoopy
谢谢,我需要的是从网站自动抓取需要的数据,然后存入数据库。
仅仅是抓取部分网站数据的话,那就不用考虑过多的效率问题了。直接curl抓取目标网页(如果允许,最简单的file_get_contents也可),然后正则表达式或者DOM 获取数据就行了

自己写起来有点困难,有开源的吗?帮忙推荐下哦。谢谢了。

比如,我想自动抓取网络上(没有固定的url),名称为“宝马”的车的价格,然后存到一个数据库,然后我在读取出来。能写个简单代码示例吗?谢谢了。

PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号