正则表达式是字符串处理的基础设施,本质是描述字符串模式的语法规则;JavaScript 中通过 String 和 RegExp 对象原生支持,test() 返回布尔值用于判断,match() 返回数组用于提取,需注意 null 与空数组的真值差异。

正则表达式不是“高级技巧”,而是字符串处理的基础设施
它本质是一套描述字符串模式的语法规则,不是编程语言,但所有主流语言都内置支持。在 JavaScript 中,它直接集成在 String 和 RegExp 对象里,不需要额外引入库。
test() 和 match() 是最常用、也最容易混淆的两个方法
test() 只返回 true 或 false,适合做条件判断;match() 返回匹配结果数组(或 null),适合提取内容。忽略这点会导致逻辑错误,比如用 match() 的返回值直接进 if 判断——空数组 [] 是真值,但 null 是假值,行为不一致。
- 检查邮箱格式:
const email = "user@example.com"; /email@example\.com$/.test(email); // true
- 提取所有数字:
"abc123def456".match(/\d+/g); // ["123", "456"]
- 注意全局标志
g:没加g时,match()只返回第一个匹配及其捕获组信息,加了才返回全部纯字符串
字面量写法 /pattern/flags 和构造函数 new RegExp("pattern", "flags") 有关键区别
字面量写法中,反斜杠不需要双写;而构造函数的 pattern 是字符串,所以每个 \ 都得写成 \,否则会被 JS 字符串解析阶段吃掉。这是初学者踩坑最多的地方之一。
- 匹配一个反斜杠:
/\\/(字面量),但new RegExp("\\\\")(构造函数) - 动态拼接正则时必须用构造函数,比如:
const ext = "jpg"; const re = new RegExp(`\\.(${ext})$`, "i"); // 匹配 .jpg(不区分大小写) - flag 参数不能写在字符串里,
new RegExp("/\\d+/g")是错的——斜杠和 flag 都不该出现在字符串 pattern 中
常见陷阱:贪婪匹配、忽略大小写、Unicode 字符支持
默认情况下,*、+、? 都是“贪婪”的,会尽可能多匹配;想“懒惰”匹配得加 ? 后缀,比如 .*?。另外,/u 标志对 emoji 或中文字符很关键,否则 . 可能无法正确匹配某些 Unicode 码点。
立即学习“Java免费学习笔记(深入)”;
- 错误:提取 HTML 标签内容时写
/(.*)/ → 会从第一个一直匹配到最后一个- 正确:用懒惰量词
/(.*?)/- 匹配 emoji:
/??/u.test("Hello ??")—— 没u标志可能返回false 正则本身没有“复杂”或“简单”之分,难的是把自然语言需求准确翻译成符号组合。每次写完,务必用真实样例字符串跑一遍,尤其关注边界情况:空字符串、特殊字符、嵌套结构、编码差异。i标志只影响 ASCII 字母,对中文、数字无影响;g控制是否全局搜索;m让^和$匹配每行开头结尾 - 正确:用懒惰量词











