问:数据采集有关问题-内容由AJAX动态加载

php中文网
发布: 2016-06-13 13:39:56
原创
1002人浏览过

问:数据采集问题-内容由AJAX动态加载
最近一直在看PHP数据采集的知识,却在采集一些网站内容时遇到了一个大困难,例如在当当网的周排行榜:bang.dangdang.com/book/bestSeller/ 页面,这些列表数据也是AJAX获取的,不能直接获取源代码进行分析,我追踪它内容的获取是由以下的的AJAX代码加载的:

  //动态调用右侧内容
$.ajax({
url: "contentList.php?catpath="+ strCatPath + "&type=" + strType + "&year=" + strYear + "&month=" + strMonth + "&range=" + strRange,
cache: false,
type: "POST",
data: "catTitleName="+catTitleName+"&catTitleOther="+catTitleOther,
success: function(html){
$("#divContentDateList").css("display","none");
$("#divContentDateList").html(html);
$("#divContentDateList").fadeIn("slow");
}
});

这里可以看到,这些列表内容来自contentList.php,传回的内容在html变量里面,请问下一步该怎么办,我在本地也写一个请求contentList.php的AJAX文件吗,还是获取到html的值再进行数据采集

就是说,对这种AJAX动态加载的页面,数据采集方法:
1、自己写一个JS,请求它的服务器脚本,获取返回内容
2、获取它已经返回的内容

在实际操作中,是哪一种在应用呢,怎样获取呢,请求大哥哥大姐姐教教小弟,不胜感激

------解决方案--------------------
你要自己写contentList.php取采集内容
可以用cURL加正则表达式实现
------解决方案--------------------
源程序应该是用AJAX获取用户信息,同时传输到contentList.php做下一步处理,任何信息都要进行一些处理的吧。处理结果又返回来给页面,页面才做出响应。

相关标签:
最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号