要匹配特定文件扩展名,需用正则表达式锚定结尾并正确分组。1. 匹配单个扩展名时,使用 $ 锚定符确保以目标扩展名结尾,如 r'\.txt$';2. 匹配多个扩展名之一时,用非捕获组结合锚定符,如 r'.(?:jpg|png|gif)$';3. 动态生成扩展名列表时可拼接字符串实现;4. 忽略大小写时加 re.ignorecase 标志;5. 处理路径时应先提取文件名再匹配,防止误判路径中的点号。
想用 Python 正则匹配特定的文件扩展名,关键在于准确表达“以某个扩展名结尾”的结构。最常用的做法是使用 $ 锚定符来确保匹配的是字符串末尾,并结合分组选择多个扩展名。
如果你想匹配 .txt 结尾的文件名,可以这样写:
import re pattern = r'.txt$'
这里的 .txt 用来匹配字面量 .txt,而 $ 表示字符串的结束位置。这样就能保证只匹配以 .txt 结尾的字符串,避免误匹配如 .txt.bak 这类情况。
立即学习“Python免费学习笔记(深入)”;
常见错误是忘记加 $,比如写成 .txt,这会导致像 file.txt.bak 也会被错误地匹配。
如果你要同时匹配 .jpg、.png 和 .gif,可以用正则的“或”语法:
pattern = r'.(?:jpg|png|gif)$'
这样就能匹配任意以这三个扩展名结尾的文件名。注意每个扩展名前都要加 .,否则 .pngx 这样的也会被错误识别为 .png。
也可以写成更通用的形式,比如:
extensions = ['jpg', 'png', 'gif'] pattern = r'.(?:' + '|'.join(extensions) + r')$'
这样方便动态生成支持的扩展名列表。
有些时候扩展名可能是大写的,比如 .JPG 或 .Png。这时候可以在编译正则时加上 re.IGNORECASE 标志:
re.match(r'.(jpg|png)$', filename, re.IGNORECASE)
这样 .JPG、.jpg、.jPg 都会被视为匹配项。但要注意这个标志会影响整个模式的字母匹配行为,不局限于括号内的内容。
在实际应用中,文件名可能包含路径,例如 /home/user/file.txt。为了防止误匹配路径中的点号(如 tar.gz 被认为是 .gz),可以先提取出文件名部分再做判断:
import os filename = os.path.basename(path)
然后再对 filename 使用正则匹配。这样能确保你真正检查的是文件名,而不是路径中的一部分。
基本上就这些。掌握这几个要点,就能写出准确又安全的扩展名匹配规则了。
以上就是Python正则如何匹配特定的文件扩展名?的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号