正则表达式是JS处理文本的基础设施,非高级技巧;核心入口为RegExp对象及match()、test()、replace()等方法;创建方式有字面量(/abc/gi)和构造函数(new RegExp('abc','gi')),后者需双写反斜杠;test()返回布尔值,match()返回数组或null,受g标志影响显著;常见陷阱包括标志位误用、贪婪匹配未惰性化、特殊字符转义不足;真正难点在于将自然语言需求精准转化为正则逻辑。

正则表达式不是 JavaScript 独有的,但 JS 提供了原生支持,RegExp 对象和字符串方法(如 match()、test()、replace())是核心入口。它本质是一套描述字符串模式的语法规则,不是“高级技巧”,而是处理文本的基础设施——用错地方或写错标志位,匹配就失效。
如何创建 RegExp 对象:字面量 vs 构造函数
两种方式行为基本一致,但有关键差异:
- 字面量写法:
/abc/gi—— 斜杠包裹,末尾标志位(如g、i)不能动态拼接 - 构造函数写法:
new RegExp('abc', 'gi')—— 模式和标志必须为字符串,适合运行时拼接(比如用户输入的关键词),但反斜杠要双写:new RegExp('\\d+', 'g') - 注意:构造函数中传入的字符串会被解析两次(一次 JS 字符串转义,一次正则引擎解析),容易漏掉一个
\,这是最常出错的地方
test() 和 match() 的实际区别
test() 只返回布尔值,适合做条件判断;match() 返回匹配结果数组或 null,但行为受全局标志 g 影响极大:
- 没加
g:返回第一个匹配的详细信息(含index、input),即使只找一个也建议用match()获取位置 - 加了
g:只返回纯匹配字符串数组,丢掉所有位置信息;此时若想同时拿到索引,得用exec()循环调用 - 空数组不等于 false ——
str.match(/x/g)在无匹配时返回null,不是[],直接forEach会报错
常见陷阱:标志位、贪婪匹配、特殊字符转义
三个高频翻车点:
立即学习“Java免费学习笔记(深入)”;
-
g标志让lastIndex生效,但只对同一个RegExp实例起作用;重复使用字面量(如/\d/g.test(str))每次都是新实例,lastIndex不累积 —— 所以循环匹配必须用构造函数或保存实例 - 默认贪婪匹配(
.*匹配尽可能长),想“懒惰”得加?(如.*?),否则'a12b'.match(/.*/) 会匹配整个中间段,而非第一个div- 在正则中匹配字面意义的
.、+、?、(、)等,必须加反斜杠转义;但写在字符串里时,JS 先吃掉一层,所以new RegExp('\d+') → 错误,得写new RegExp('\\d+')真正难的不是语法本身,而是把自然语言需求准确翻译成正则逻辑——比如“邮箱”没有统一标准,
/.+@.+\..+/看似合理,但会放过a@b.c.d.e或拒绝合法的user+tag@example.com。别迷信“万能正则”,先明确边界,再小步验证。 - 在正则中匹配字面意义的











