Python正则表达式如何匹配URL链接？完整模式

爱谁谁

发布时间：2025-06-26 22:27:02

965人浏览过

来源于php中文网

原创

匹配url的正则表达式可以写为：https?://(?:www.)?[a-za-z0-9-]+(.[a-za-z]{2,})+(/\s*)?，其结构分为三部分：1. 匹配协议头http或https；2. 匹配域名，包括可选的www前缀、域名主体和顶级域名；3. 可选的路径和参数部分。在使用时可通过python的re模块进行匹配，并可根据需求添加行首行尾锚点、扩展端口号与ip地址支持，或结合urllib.parse处理更复杂的场景。

Python正则表达式如何匹配URL链接？完整模式

匹配URL链接的正则表达式其实并不复杂，但要写出一个既全面又实用的模式，就需要考虑各种常见的URL格式。下面这个正则表达式基本上可以覆盖大多数常见情况：

https?://(?:www\.)?[a-zA-Z0-9-]+(\.[a-zA-Z]{2,})+(/[^\s]*)?

接下来我们分几个部分来解释这个正则表达式的结构，并给出一些使用建议。

匹配协议头：http 或 https

URL通常以 http:// 或 https:// 开头。这部分可以用以下正则表示：

立即学习“Python免费学习笔记（深入）”；

https?

这里的 s? 表示“s”是可选的，也就是既可以匹配 http 也可以匹配 https。

Lateral App

整理归类论文

下载

匹配域名（包括 www 和非 www）

域名部分通常由字母、数字、短横线组成，可能带有 www. 前缀。我们可以这样写：

(?:www\.)?[a-zA-Z0-9-]+(\.[a-zA-Z]{2,})+

(?:www\.)? 表示可选的 www.，且不捕获该组（非捕获组）
[a-zA-Z0-9-]+ 表示域名主体，如 google、example 等
(\.[a-zA-Z]{2,})+ 表示顶级域名，如 .com、.org、.co.uk 等，至少两个字符

匹配路径和参数（可选）

URL中可能会有路径或查询参数，比如 /about 或 ?id=123。这部分可以用：

(/[^\s]*)?

/ 表示路径开始
[^\s]* 表示除了空格以外的任意字符（即路径和参数）
整个用 ()? 包裹，表示整个路径部分是可选的

实际使用建议

在Python中使用时，可以结合 re 模块进行匹配：

import re

pattern = r'https?://(?:www\.)?[a-zA-Z0-9-]+(\.[a-zA-Z]{2,})+(/[^\s]*)?'
text = '访问我们的网站 https://example.com/about 获取更多信息'

urls = re.findall(pattern, text)
print(urls)

注意事项：

如果你只想匹配完整的URL，可以加上行首行尾锚点：^...$
如果需要处理带端口号、IP地址的URL，还需要扩展正则表达式
对于更复杂的URL提取需求，可以考虑使用 urllib.parse 配合正则一起处理

总结一下

上面这个正则已经能应对大部分常规URL的匹配了，不需要追求完美覆盖所有可能，除非你的应用场景特别复杂。在实际开发中，根据具体输入数据做适当调整是最实用的做法。

基本上就这些。

Python文件编码检测方案_chardet应用解析【指导】

Python生成器状态管理_暂停恢复解析【教程】

Python函数测试策略_单元覆盖解析【指导】

Python函数参数校验_健壮性设计说明【指导】

Python文件编码统一_跨平台兼容说明【指导】

相关标签:

python python正则表达式 Python 正则表达式 http https

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：使用Bandit安全工具如何检测出except: pass高风险代码？下一篇：正则表达式中的原子组是什么？如何使用？

作者最新文章

三星手机怎么绑定亚马逊账号_三星手机亚马逊账号绑定教程【方法】

2025-12-30 14:02

BOOKING怎样使用智能推荐_BOOKING推荐算法与偏好设置【方法】

2025-12-30 14:03

FanFiction怎么参与社区活动 FanFiction活动报名及参与步骤【攻略】

2025-12-30 14:03

html5怎么文字缩进_HTML5用CSS text-indent或设文本首行缩进【缩进】

2025-12-30 14:05

html5如何插入云端文档_html5云端文档嵌入与实时同步【技巧】

2025-12-30 14:05

bing浏览器地图入口_bing地图网页版直接访问地址

2025-12-30 14:05

html5怎么实现点播_html5用video标签加JS控制实现视频点播播放【点播】

2025-12-30 14:07

Win10怎样卸载NVIDIAGeForceExperience_Win10卸载GFE步骤【步骤】

2025-12-30 14:08

批改网ai检测工具怎么检测多语言作文_批改网ai检测工具多语言切换与检测支持【技巧】

2025-12-30 14:09

巨量百应怎么设置定向推广人群_巨量百应人群定向配置技巧【要点】

2025-12-30 14:10

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

715

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

625

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

738

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

617

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1235

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

574

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

697

2023.08.11