javascript - 如何保存含有大量js生成内容的网页?
ringa_lee
ringa_lee 2017-04-10 14:29:35
[JavaScript讨论组]

现在网站大多用Javascript动态生成一些内容,用浏览器打开可以看到渲染好的页面,用鼠标可以选择复制。而用浏览器保存时,却只能保存下带Javascript源码的内容,将解析后的内容保存下来。不知道能否保存解析后的,在浏览器显示的最终样式呢?
已经尝试用Firefox的保存,保存为单个网页,保存为文本都无法找到由Javascript控制生成的内容。
比如:我打开Bing词典,里面的的英英解释是由Javascript生成的,在浏览器中当然可以选择我想要的内容;而用Firefox保存之后,则找不到由Javascript生成的内容。

下面是由Firefox保存为文本文件的结果:

        权威英汉双解
<javascript:void(0);>
    英汉
<javascript:void(0);>
    英英
<javascript:void(0);>
    网络释义

有没有办法保存整个已经被浏览器解析之后的网页呢?
听说使用爬虫时可以用selenium,phantomjs之类的库进行解析,但是自己的需求没有这么麻烦,感觉一两个网页用不着。而手工复制的话又太笨了。有没有一个半自动化的方法呢?
比如说,用Python控制IE打开一个网页,然后保存下已经解析的内容,再对保存下的内容进行分析。

ringa_lee
ringa_lee

ringa_lee

全部回复(4)
阿神

首先,我不知道我想的对不对

爬虫刚入门,我只知道提交给服务器内容,服务器返回给我对应的内容。


这段返回的内容有你想要的,通过正则应该可以得到
请求的内容Request URL:http://cn.bing.com/dict/?q=python&go=%E6%8F%90%E4%BA%A4&qs=bs&form=Z9LH5

应该说的有很多不对,我对这个问题不怎么了解。如果有错误希望指出来,因为很多时候不是不想学习,实在不知道学什么。学习的关键词都不知道。

PHPz

F12->选中element->右键html标签->copy as html
不知道这样满不满足你的需求。

PHP中文网

调试工具里面可以保存内存中当前dom树的,这个就是你需要的结果了

黄舟

http://doc.shenjianshou.cn/
可以参考下这个,爬虫开发文档 。采用javascript编写爬虫。

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号