Python:如何解析这个页面呢?
大家讲道理
大家讲道理 2017-04-17 11:54:08
[Python讨论组]

请问,使用python如何解析该页面的源码呢?以便获取所需要的数据

:html源码中的重要数据,好像是以json格式存储的吧?而且好像进行了某种格式的编码转换,本人小菜,希望各位帮忙指点下

大家讲道理
大家讲道理

光阴似箭催人老,日月如移越少年。

全部回复(1)
大家讲道理

强烈的既视感啊,总觉得在sf上曾经有人说过要抓这个网站……

我的想法是最好能够有浏览引擎,把这个页面渲染出来,然后抓DOM树。

极重AJAX依赖的页面,我们关注的是Javascript执行出来的结果。如果去分析Javascript的源码本身,这个从可靠性上就差了一层。

如果真要简单分析,那么我可以肯定的说:中间大段的那些内容JSON可读。你可以把从网页里抽出来的这部分内容,放到http://jsoneditoronline.org/里边自己看看。

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号