掌握JavaScript正则表达式高级技巧可高效处理文本,捕获组()与反向引用\1、命名捕获提升可读性;前瞻(?=...)与后瞻(?

JavaScript 正则表达式提供了强大的文本匹配能力,除了基础的字符匹配外,高级模式能处理更复杂的场景。掌握这些技巧,可以高效完成数据验证、文本提取和替换等任务。
捕获组与反向引用
使用括号 () 可以创建捕获组,将匹配的一部分保存起来,供后续使用。反向引用通过 \1、\2 等编号引用前面的捕获内容。
例如,匹配重复单词:
const regex = /\b(\w+)\s+\1\b/g;"hello hello world".match(regex); // ["hello hello"]
这里 \1 引用第一个捕获组的内容。也可命名捕获组,提高可读性:
立即学习“Java免费学习笔记(深入)”;
const regex = /\b(?word>\w+)\s+\kconst match = "test test".match(regex);
// 匹配结果可通过 match.groups.word 访问
前瞻与后瞻断言
断言用于判断某个位置前后是否满足条件,但不包含在匹配结果中。
- 正向前瞻 (?=...):确保后面跟着特定内容
- 负向前瞻 (?!...):确保后面不是特定内容
- 正向后瞻 (?:确保前面是特定内容
- 负向后瞻 (?:确保前面不是特定内容
例如,提取金额数字但不包括货币符号:
JSON(JavaScript Object Notation) 定义:一种轻量级的数据交换格式,具有良好的可读和便于快速编写的特性。业内主流技术为其提供了完整的解决方案(有点类似于正则表达式,获得了当今大部分语言的支持),从而可以在不同平台间进行数据交换。JSON采用兼容性很高的文本格式,同时也具备类似于C语言体系的行为。有需要的朋友可以下载看看
或匹配不以“test”开头的单词:
const regex = /\b(?!test)\w+\b/g;"Notest myword testok".match(regex); // ["Notest", "myword"]
惰性匹配与贪婪控制
默认情况下,量词如 *、+ 是贪婪的,尽可能多地匹配。添加 ? 变为惰性匹配。
例如,提取 HTML 标签内的内容:
const greedy = /const lazy = /
"
// 匹配整个字符串(贪婪)
"
// 只匹配 "
修饰符的应用
修饰符改变正则行为:
- g:全局匹配
- i:忽略大小写
- m:多行模式,^ 和 $ 匹配每行起止
- s:点号 . 匹配换行符(需启用 dotAll)
例如,跨行提取注释:
const regex = /\/\*.*?\*\//gs;const code = `/*
多行注释
*/ function f() {}`;
code.match(regex); // ["/*\n 多行注释\n*/"]
基本上就这些关键点。灵活组合捕获、断言和修饰符,能让正则应对大多数复杂文本处理需求。不复杂但容易忽略的是边界情况和性能,建议在实际使用前充分测试。









