python的session.post,去爬列表,为什么列表会重复数据
迷茫
迷茫 2017-04-18 09:03:17
[Python讨论组]
#-*- coding:utf-8 -*-
import requests


url = 'http://httpbin.org/post'

session = requests.Session()

payload = {'day': '201607'}
#列表页数,页数,这里是读取每一页
for i in range(1, 10):
    payload2 = payload.copy()
    payload2.update({
        'page': i,
    })
    data = session.post(url,data=payload2)

    with open ('hi.json'.format(i), 'w') as fp:
        fp.write(data.text)
        print data.text

版本 python 2.7.6

去爬列表
但是这个列表 爬出来的数据会重复
按照道理来说 session已经代进去了 为什么每页会重复数据?

在网页端 目标的数据 每页都是不一样的 正常的

网站每次第一次访问 都会生成不同数据 数量一样 只是排序不一样
爬下来的时候 可能因为这样
会导致我得到部分重复数据

有没什么办法 有其他方法吗 或者用第三方的模块

迷茫
迷茫

业精于勤,荒于嬉;行成于思,毁于随。

全部回复(0)
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号