正则表达式匹配括号的差异
使用正则表达式时,匹配小括号会出现不同的结果,这可以通过两个示例来解释:
import re my_sin = re.compile(r'sin\(.+?\)', re.dotall) print(re.findall(my_sin, 'sin(30)')) trigonometric_functions = re.compile(r'(cos|sin|tan|arcsin|arccos|arctan)\(.+?\)', re.dotall) print(re.findall(trigonometric_functions, 'sin(30)'))
第一个正则表达式 my_sin 成功地匹配并提取了小括号内的内容,而第二个正则表达式 trigonometric_functions 却没有。这是因为 python 的 findall 函数的行为不同,具体取决于正则表达式中是否存在捕获组。
捕获组允许正则表达式匹配子串,并可以通过反向引用来访问这些子串。在 my_sin 正则表达式中,小括号形成了一个捕获组,将括号内的内容作为第一个捕获组。因此,findall 函数返回了一个包含括号内内容的列表。
而 trigonometric_functions 正则表达式中用于匹配三角函数的模式 (cos|sin|tan|arcsin|arccos|arctan) 中没有捕获组。这导致 findall 函数仅返回匹配的整个字符串,而不包含小括号内的内容。
为了解决这个问题,可以使用 非捕获组,如下所示:
trigonometric_functions = re.compile(r'(?:cos|sin|tan|arcsin|arccos|arctan)\(.+?\)', re.DOTALL) print(re.findall(trigonometric_functions, 'sin(30)'))
在这种情况下,(?:) 用于创建一个非捕获组,它允许模式匹配小括号内的内容,但不将其作为捕获组。这样,findall 函数将只返回括号内匹配的子串。
以上就是正则表达式中匹配括号,为什么有时会丢失括号内的内容?的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号