讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 后端开发 > Python教程 > 正文

Python 爬虫返回403错误解决方法

伊谢尔伦

发布： 2017-04-29 10:05:50

原创

6891人浏览过

问题

抓取数据时，通常调试信息是：

DEBUG: Crawled (200) <GET http://www.php.cn/> (referer: None)

登录后复制

如果出现

DEBUG: Crawled (403) <GET http://www.php.cn/> (referer: None)

登录后复制

表示网站采用了防爬技术anti-web-crawling technique（Amazon所用），比较简单即会检查用户代理（User Agent）信息。

小爱开放平台

小爱开放平台

小米旗下小爱开放平台

小爱开放平台

291

小爱开放平台

解决方法

在请求头部构造一个User Agent，如下所示：

def start_requests(self):  
    yield Request("http://www.php.cn/",  
                  headers={'User-Agent': "your agent string"})

登录后复制

以上就是Python 爬虫返回403错误解决方法的详细内容，更多请关注php中文网其它相关文章！

相关标签：

python

大家都在看：

Python数据可视化从入门到精通完整操作指引【教学】 Python自动检测图片重复内容并归类整理的脚本结构逻辑【指导】 Python构建自动比对文件差异的脚本逻辑与版本管理方案【教程】 Python实现深度学习中图像识别的详细教程【教程】 Python使用聚类算法拆分用户群体的常见分析方法【教程】

python速学教程(入门到精通)

python速学教程(入门到精通)

python怎么学习？python怎么入门？python在哪学？python怎么学才快？不用担心，这里为大家提供了python速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

来源：php中文网

上一篇：学习Python到底能干什么下一篇：python过滤掉字符串数组中某个敏感词

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

MySQL使用cmd命令修改密码的操作

1970-01-01 08:00:00
介绍Django查询数据库时各种种类的排序

1970-01-01 08:00:00
php ob缓存介绍以及ob函数详解

2023-03-07 21:36:01
php深入理解刷新缓冲区函数用法

2023-03-11 10:18:01
什么是php类？php类的属性详解

2023-03-11 13:22:01
php7函数，声明，返回值等新特性介绍

2023-03-11 15:08:02
php array_keys()如何获取数组键名用法详解

2023-03-12 07:44:02
javascript如何操作cookie来实现用户登录代码实例详解

1970-01-01 08:00:00
javascript如何使用函数和返回值用法实例详解

1970-01-01 08:00:00
javascript基本函数debounce、poll和once实例用法详解

1970-01-01 08:00:00

最新问题

自动化脚本从零到精通生成报告的实践方法【教程】自动化报告脚本成功关键在于明确目标场景、选对Python工具链（requests/pandas/Jinja2等）、实现无人值守（crontab+日志+校验）并持续迭代优化。

2025-12-15 22:26:02

429

Python如何做时间序列预测_预测模型训练全流程【教程】 Python时间序列预测核心是五步流程：数据准备→特征工程→模型选择→训练验证→预测部署；关键在理解数据特性、处理时间依赖性、避免未来信息泄露。

2025-12-15 22:26:02

428

Python编写自动监控系统资源使用率的脚本流程讲解【指导】答案是：用Python+psutil编写轻量监控脚本，定期采集CPU、内存、磁盘、网络指标，超阈值时计数告警并记录日志。核心包括模块化采集函数、连续超限判断、time.sleep定时循环、异常写入alert.log，支持跨平台部署。

2025-12-15 22:24:07

362

python如何查询函数 Python中查询函数最常用方法是help()和inspect模块：help()快速查看帮助信息，inspect提供签名、文档、源码等详细信息，辅以__doc__等属性和dir()/hasattr()动态检查。

2025-12-15 22:24:07

934

Python实现图像处理中模型调优的详细教程【教程】图像处理模型调优是数据、结构、训练、评估的闭环过程：先跑通模型，再逐层定位瓶颈，用可复现实验验证改进；核心包括数据质量与增强、轻量化结构适配、损失函数与优化器组合、验证驱动早停。

2025-12-15 22:23:02

288

Python数据可视化从入门到精通完整操作指引【教学】 Python数据可视化核心是用图表讲清数据故事，需按序安装Matplotlib、Pandas、Seaborn三库，从散点图理解参数逻辑，依分析目标选图型，并通过单位、图例、字体三步提升可读性。

2025-12-15 22:21:06

700

Python自动检测图片重复内容并归类整理的脚本结构逻辑【指导】 Python图片去重归类应优先用pHash实现快速鲁棒比对，再依规模升级至ResNet/CLIP特征嵌入与余弦相似度聚类，结合EXIF规则（时间＞设备＞场景标签）自动构建多级目录，并通过流式处理、质量过滤和报告生成保障工程稳定性。

2025-12-15 22:20:02

956

Python构建自动比对文件差异的脚本逻辑与版本管理方案【教程】 Python文件差异比对需明确目标、选对工具、管好版本：聚焦关键文件，按内容（filecmp/difflib）、元数据（os.stat）、结构（filecmp.dircmp）分层比对；用watchdog事件驱动监听变更；辅以时间戳快照、diff_index.json记录和分级输出告警。

2025-12-15 22:19:02

187

Python实现深度学习中图像识别的详细教程【教程】图像识别Python实现需完成数据准备、模型搭建、训练评估、测试部署四步：统一图像格式与标签，用预训练模型微调，监控损失防过拟合，严格复现预处理流程进行推理。

2025-12-15 22:16:02

596

Python使用聚类算法拆分用户群体的常见分析方法【教程】聚类拆分用户群体的核心是使结果反映业务逻辑，需兼顾数据准备、特征工程与结果解读；应构建RFM、时序、渠道等行为特征并标准化，避免K-means局限，选用K-means++/DBSCAN/GMM等算法，结合可视化与业务指标映射命名簇群，并做稳定性检验。

2025-12-15 22:15:06

365

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新Python教程从入门到精通

4983次学习
收藏
Django 教程

21430次学习
收藏
SciPy 教程

8040次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部