微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 后端开发 > Python教程 > 正文

Python提取网页中超链接的方法

高洛峰

发布： 2017-02-22 16:52:18

原创

3500人浏览过

很多人在一开始学习python，会打算用作爬虫开发。既然要做爬虫，首先就要抓取网页，并且从网页中提取出超链接地址。这篇文章给大家分享一个简单的方法，有需要的可以参考借鉴。

下面是最简单的实现方法，先将目标网页抓回来，然后通过正则匹配a标签中的href属性来获得超链接

代码如下：

import urllib2
import re
 
url = 'http://www.sunbloger.com/'
 
req = urllib2.Request(url)
con = urllib2.urlopen(req)
doc = con.read()
con.close()
 
links = re.findall(r'href\=\"(http\:\/\/[a-zA-Z0-9\.\/]+)\"', doc)
for a in links:
  print a

登录后复制

法语写作助手

法语写作助手

法语助手旗下的AI智能写作平台，支持语法、拼写自动纠错，一键改写、润色你的法语作文。

法语写作助手

31

法语写作助手

更多Python提取网页中超链接的方法相关文章请关注PHP中文网！

立即学习“Python免费学习笔记（深入）”；

大家都在看：

Python调用API接口如何实现定时调用_Python定时调用API接口实现自动化任务的方案 Python函数怎么定义_Python函数定义语法与实际应用方法 Python官网博客与新闻的订阅方法_Python官网最新动态跟踪技巧 Python3官网首页怎么进入_Python3官网首页进入方法与注意事项 Python入门如何定义使用函数_Python入门函数编程的完整教程

python速学教程(入门到精通)

python速学教程(入门到精通)

python怎么学习？python怎么入门？python在哪学？python怎么学才快？不用担心，这里为大家提供了python速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

来源：php中文网

上一篇：Python中list初始化方法示例下一篇：python解决Fedora解压zip时中文乱码的方法

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

.NET微信公众号获取OpenID和用户信息实例解析

1970-01-01 08:00:00
图文详解.Net语言Smobiler开发之如何仿微信朋友圈的消息样式

1970-01-01 08:00:00
ASP.NET代码轻松实现微信抢红包

1970-01-01 08:00:00
C#开发微信多客服功能及开发集成实例

1970-01-01 08:00:00
C#开发微信门户应用管理系统功能介绍

1970-01-01 08:00:00
微信公众平台消息接口开发地理位置查询附近商家实例

1970-01-01 08:00:00
微信开发系列教程（3）

1970-01-01 08:00:00
微信开发系列教程（2）

1970-01-01 08:00:00
微信开发系列教程（1）

1970-01-01 08:00:00
解析微信小程序SocketIO实例

1970-01-01 08:00:00

最新问题

pythonfor循环怎么对循环输入数字求和_pythonfor循环接收用户输入数字并求和的方法先获取输入数字的个数n，再通过for循环n次接收用户输入的数字并累加求和。使用float(input())读取数值，total+=num实现累加，建议加入try-except处理非数字输入，确保程序健壮性。

2025-11-12 01:51:16

996

SKlearn如何在python安装? 安装scikit-learn需使用pipinstallscikit-learn或condainstallscikit-learn；2.导入时用importsklearn；3.验证安装成功可输出sklearn.__version__。

2025-11-12 00:31:20

377

Python入门如何安装第三方库_Python入门包管理的必备技能使用pip安装第三方库是Python开发常用方法，通过虚拟环境可隔离项目依赖避免冲突，结合requirements.txt能批量管理库版本，配置国内镜像源可加速下载，而conda则适合数据科学领域复杂环境管理。

2025-11-11 23:59:02

916

Python值错误ValueError常见场景及修复技巧 ValueError常见于类型正确但值不合法的情况，如字符串转数字失败、解包数量不匹配、函数参数越界或查找不存在元素。1.字符串转数字时需用try-except或isdigit()判断；2.解包应确保数量一致，可用*rest收集多余项；3.调用如math.sqrt前应验证输入非负；4.查找元素前先用in检查是否存在。通过输入校验和异常处理可有效避免此类错误，提升代码健壮性。

2025-11-11 23:52:02

708

Python3官网入口在哪里_Python3官网入口位置与访问步骤详解 Python3官网入口是https://www.python.org/，进入后点击Downloads可按系统下载安装包，通过Documentation可获取多版本开发文档。

2025-11-11 23:51:33

474

Python官网安全编程指南的学习_Python官网安全最佳实践教程遵循安全编程实践可有效防止数据泄露和系统攻击。首先，防范命令注入，禁用os.system()，改用subprocess.run()参数化列表并验证输入；其次，防御CRLF与HTTP头注入，净化输出数据，使用urllib.parse.quote()编码，优先调用框架安全函数；第三，严格处理用户输入，采用Werkzeug转义、参数化查询或ORM避免SQL注入和XSS，利用Pydantic等工具进行数据验证；第四，强化密码存储，使用bcrypt、scrypt或argon2等强哈希算法，通过passli

2025-11-11 23:41:02

491

Python入门如何实现多线程_Python入门并发编程的初步尝试使用多线程可提升Python程序效率，常用方法包括：一、threading模块创建线程，通过Thread类实例启动任务，需调用start()和join()；二、继承Thread类重写run()方法，便于封装复杂逻辑；三、使用ThreadPoolExecutor管理线程池，控制并发数量并复用线程；四、利用queue.Queue实现线程间安全通信，避免竞争条件。

2025-11-11 23:29:02

452

Python网页版怎样做用户行为分析_Python网页版用户行为追踪与分析方法首先通过前端埋点和后端接口采集用户行为数据，接着利用Flask接收数据并存储至SQLite或MySQL等数据库，再使用Pandas对数据进行清洗与分析，计算PV、UV、留存率、转化漏斗等指标，最后借助Plotly或Dash生成可视化报表并在网页展示，形成完整的用户行为分析系统。

2025-11-11 23:15:02

941

python中update更新字典的方法 update()方法用于更新字典内容，语法为dict.update(other)；可传入字典、包含键值对的可迭代对象或关键字参数；若键存在则覆盖值，不存在则添加新键值对；如d={‘a’:1,‘b’:2}调用d.update({‘b’:3,‘c’:4})后输出{‘a’:1,‘b’:3,‘c’:4}；使用关键字参数时键必须为合法标识符；传入元组列表形式如[(‘b’,3),(‘c’,4)]也可批量更新；该方法直接修改原字典不返回新对象，需复制原字典以保留原始数据；常用于合并配置或补充默认值场景。

2025-11-11 23:06:02

649

Python调用API接口如何进行接口测试_Python调用API接口进行接口功能测试的方法答案：可通过requests库发送请求并结合unittest或pytest框架验证API状态码与响应数据。1、使用requests发送GET/POST请求，检查status_code及JSON字段；2、用unittest组织测试类提升结构化程度；3、利用pytest实现简洁断言与参数化；4、通过jsonschema校验数据结构完整性。

2025-11-11 23:01:02

795

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

CSS3 最新版参考手册

139317次学习
收藏
CSS3进阶视频教程

23951次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部