微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 后端开发 > Python教程 > 正文

Python3使用requests包抓取并保存网页源码的方法介绍

高洛峰

发布： 2017-03-07 15:50:19

原创

2799人浏览过

本文实例讲述了python3使用requests包抓取并保存网页源码的方法。分享给大家供大家参考，具体如下：

使用Python 3的requests模块抓取网页源码并保存到文件示例：

import requests
html = requests.get("http://www.baidu.com")
with open('test.txt','w',encoding='utf-8') as f:
 f.write(html.text)

登录后复制

这是一个基本的文件保存操作，但这里有几个值得注意的问题：

1.安装requests包，命令行输入pip install requests即可自动安装。很多人推荐使用requests，自带的urllib.request也可以抓取网页源码

立即学习“Python免费学习笔记（深入）”；

2.open方法encoding参数设为utf-8，否则保存的文件会出现乱码。

3.如果直接在cmd中输出抓取的内容，会提示各种编码错误，所以保存到文件查看。

存了个图

存了个图

视频图片解析/字幕/剪辑，视频高清保存/图片源图提取

存了个图

17

存了个图

4.with open方法是更好的写法，可以自动操作完毕后释放资源。

另一个例子：

import requests
ff = open('testt.txt','w',encoding='utf-8')
with open('test.txt',encoding="utf-8") as f:
 for line in f:
 ff.write(line)
ff.close()

登录后复制

这是演示读取一个txt文件，每次读取一行，并保存到另一个txt文件中的示例。

因为在命令行中打印每次读取一行的数据，中文会出现编码错误，所以每次读取一行并保存到另一个文件，这样来测试读取是否正常。（注意open的时候制定encoding编码方式）

更多Python3使用requests包抓取并保存网页源码的方法介绍相关文章请关注PHP中文网！

大家都在看：

Python3安装后怎么设置快捷方式_Python3桌面快捷方式创建方法 Python3官网最新地址是什么_Python3官网最新地址及更新说明 Python3怎么调试代码_Python3代码调试方法与常用工具介绍 Python3安装目录怎么选择_Python3安装路径选择建议与注意事项 Python爬虫怎样使用requests库_Python爬虫requests库的安装与基本用法

python速学教程(入门到精通)

python速学教程(入门到精通)

python怎么学习？python怎么入门？python在哪学？python怎么学才快？不用担心，这里为大家提供了python速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

来源：php中文网

上一篇：Python的内置字符串方法分析下一篇：如何用Python减少循环层次和缩进的技巧

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

实现一个 Java 版的 Redis

1970-01-01 08:00:00
Asp.net使用SignalR实现发送图片

1970-01-01 08:00:00
HTML5:使用Canvas实时处理Video

1970-01-01 08:00:00
最简单的微信小程序Demo

1970-01-01 08:00:00
Python构造自定义方法来美化字典结构输出

1970-01-01 08:00:00
html设置加粗、倾斜、下划线、删除线等字体效果示例介绍

1970-01-01 08:00:00
微信小程序：如何实现tabs选项卡效果示例

1970-01-01 08:00:00
微信小程序开发教程-App()和Page()函数概述

1970-01-01 08:00:00
python中pandas.DataFrame（创建、索引、增添与删除）的简单操作方法介绍

1970-01-01 08:00:00
详解python redis使用方法

1970-01-01 08:00:00

最新问题

Python入门如何操作时间日期_Python入门时间处理的基本功掌握Python时间日期操作需使用datetime模块，首先通过fromdatetimeimportdatetime获取当前时间current_time=datetime.now()并打印；其次利用strftime("%Y-%m-%d%H:%M:%S")将时间对象格式化为指定字符串；再通过strptime(time_string,"%Y-%m-%d")将符合格式的字符串解析为datetime对象；接着对两个datetime对象做减法得timedelta，可访问days或调用total_secon

2025-11-16 00:57:29

361

Python多线程在物联网中的应用 Python多线程设备并发控制技巧多线程可提升物联网系统并发效率，适用于设备轮询、消息监听、数据聚合与指令分发；通过ThreadPoolExecutor管理线程池，控制并发数以避免资源浪费；使用threading.Lock保护共享资源如设备状态字典，防止数据竞争；结合queue.Queue实现采集、上传等线程间安全通信，解耦功能模块，提升系统稳定性与扩展性。

2025-11-15 23:53:02

528

Python3官网链接地址是什么_Python3链接地址获取与使用教程 Python3官网链接地址是https://www.python.org，该网站提供下载、文档、社区支持及开发工具等核心资源。

2025-11-15 23:49:02

933

Python3安装后怎么升级_Python3版本升级详细操作流程 1、先通过“python3--version”查看当前版本；2、访问Python官网下载最新安装包或使用系统包管理工具（如apt、yum）升级；3、推荐使用pyenv管理多版本，或从源码编译安装以避免覆盖原环境。

2025-11-15 23:40:02

189

Python3文件怎么读取_Python3文件读取操作方法与实例讲解答案：Python提供多种文件读取方法。1、用open()函数配合read()、readline()、readlines()读取文本文件，需手动close()。2、使用with语句自动管理文件开闭，推荐使用。3、读取含中文等字符时，应指定encoding=‘utf-8’。4、读取图片、音频等二进制文件需用‘rb’模式获取字节流。5、处理大文件时宜逐行迭代或分块读取，避免内存溢出，提升性能。

2025-11-15 23:33:09

614

Python调用API接口如何调用电商API_Python调用电商平台API接口获取商品信息的方法使用Python调用电商API获取商品信息的方法包括：一、用requests库发送HTTP请求，构造URL并解析JSON响应；二、按平台规则生成签名认证，确保请求合法性；三、利用官方或第三方SDK简化调用流程；四、通过分页或批量参数获取大量数据；五、设置频率限制与重试机制避免被限流。

2025-11-15 23:32:02

268

python有哪些包管理器 Python常用包管理器包括pip、conda、pipenv、poetry等，其中pip是官方推荐工具，用于安装、卸载和管理包，默认从PyPI下载；conda为跨平台工具，适用于数据科学项目，可管理Python及非Python依赖，并支持环境隔离；pipenv整合pip与virtualenv，自动管理虚拟环境并使用Pipfile记录依赖，提升开发体验；poetry功能全面，支持依赖管理、打包发布，采用pyproject.toml统一配置，适合工程化项目；setuptools配合pip使用，主要用

2025-11-15 23:31:11

400

Python多态怎么实现_Python多态原理与实际编码应用示例 1、通过继承与方法重写，子类可重定义父类方法实现多态；2、利用鸭子类型，无需继承只需同名方法即可实现动态多态；3、使用abc模块定义抽象基类，强制子类实现指定方法以规范多态接口。

2025-11-15 23:29:14

494

Python Elasticsearch DSL如何使用答案：PythonElasticsearchDSL提供了更便捷的面向对象方式操作Elasticsearch，通过安装elasticsearch-dsl库并连接服务后，可定义Document模型映射字段与索引设置，调用init()创建索引，使用save()添加文档，Search类构建match、term、range等查询，支持bool组合与聚合分析，还可通过get()更新或delete()删除文档，结合bulk实现高效批量写入，适用于复杂检索场景。

2025-11-15 23:29:02

465

Python3怎么安装到电脑上_Python3在Windows系统上的完整安装教程首先访问python.org官网下载Python安装包，选择Windows系统推荐的稳定版本并下载“python-x.x.x.exe”文件；接着双击安装文件，务必勾选“AddPythontoPATH”，然后选择“InstallNow”完成默认安装；最后通过命令提示符输入python--version和pip--version验证版本信息，并运行print("Hello,Python!")测试功能，确认安装成功。

2025-11-15 23:27:21

237

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部