扫码关注官方订阅号
请问,使用python如何解析该页面的源码呢?以便获取所需要的数据
注:html源码中的重要数据,好像是以json格式存储的吧?而且好像进行了某种格式的编码转换,本人小菜,希望各位帮忙指点下
光阴似箭催人老,日月如移越少年。
强烈的既视感啊,总觉得在sf上曾经有人说过要抓这个网站……
我的想法是最好能够有浏览引擎,把这个页面渲染出来,然后抓DOM树。
极重AJAX依赖的页面,我们关注的是Javascript执行出来的结果。如果去分析Javascript的源码本身,这个从可靠性上就差了一层。
如果真要简单分析,那么我可以肯定的说:中间大段的那些内容JSON可读。你可以把从网页里抽出来的这部分内容,放到http://jsoneditoronline.org/里边自己看看。
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
扫描下载App
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
强烈的既视感啊,总觉得在sf上曾经有人说过要抓这个网站……
我的想法是最好能够有浏览引擎,把这个页面渲染出来,然后抓DOM树。
极重AJAX依赖的页面,我们关注的是Javascript执行出来的结果。如果去分析Javascript的源码本身,这个从可靠性上就差了一层。
如果真要简单分析,那么我可以肯定的说:中间大段的那些内容JSON可读。你可以把从网页里抽出来的这部分内容,放到http://jsoneditoronline.org/里边自己看看。