优先选字面量 /pattern/flags,动态拼接用 RegExp 构造函数;邮箱、手机号、身份证正则需按业务约束编写,避免过度复杂;test() 返回布尔,exec() 返回匹配详情且受 lastIndex 影响,match() 全局时丢失分组;Unicode 匹配须加 /u 标志并慎用 \p{}。

正则表达式字面量和构造函数怎么选?
直接写 /pattern/flags 最常用,适合静态模式;动态拼接字符串时必须用 RegExp 构造函数,否则无法插入变量。
常见坑:RegExp('a+b', 'g') 中的 + 是普通字符,但如果你传入 'a+b' 字符串,反斜杠要双写:new RegExp('a\\+b', 'g'),否则会报错或匹配异常。
性能上,字面量在编译时解析,RegExp 每次执行都重新编译——循环里反复用动态正则,务必提前实例化,别写在循环体内。
验证邮箱、手机号、身份证这些常用模式怎么写?
没有“通用完美正则”,只有“够用且可控”的模式。别追求 RFC 5322 邮箱全集,那会写出不可维护的长串;按自己业务约束写更稳。
立即学习“Java免费学习笔记(深入)”;
- 邮箱(宽松校验):
/^[^\s@]+@[^\s@]+\.[^\s@]+$/—— 至少含一个 @、一个点、前后非空白 - 中国大陆手机号:
/^1[3-9]\d{9}$/—— 开头 1,第二位 3–9,共 11 位 - 18 位身份证(仅格式,不含校验码逻辑):
/^\d{17}[\dxX]$/—— 前 17 位数字,末位可为数字或x/X
注意:手机号正则不校验号段是否真实启用;身份证需额外用算法校验最后一位,正则只做长度和字符过滤。
test()、exec()、match()、replace() 有什么关键区别?
test() 最轻量,只返回 true/false,适合条件判断;exec() 返回详细匹配对象(含 index、groups),全局模式下可多次调用推进 lastIndex;match() 在非全局时返回带捕获组的数组,全局时只返回纯匹配字符串数组(丢失分组信息);replace() 的第二个参数支持字符串模板(如 )或函数,函数参数包含匹配项、分组、位置、原字符串。
容易错的地方:
- 全局正则(带
g标志)连续调用exec()会改变内部lastIndex,下次调用从上次结束位置继续;重用前记得regex.lastIndex = 0 -
str.match(/a(g)e/g)返回['age'],但str.match(/a(g)e/)返回['age', 'g', index: 0, input: 'age']—— 分组只在非全局时保留 -
replace()中的$&表示整个匹配,$1表示第一个捕获组,不是\1
中文、emoji、Unicode 字符怎么安全匹配?
默认正则把 UTF-16 代理对(如 emoji ?、生僻汉字)当两个字符处理,导致 . 匹配不全、^$ 错位、length 和实际视觉长度不符。
解决方案分三层:
- 简单场景:用
/u标志开启 Unicode 模式,让.、\w、\d等支持完整字符,^$按码点边界工作 - 需要匹配“一个视觉字符”(如取首字符、截断):用
/\p{Emoji}\p{Extended_Pictographic}/u或借助Array.from(str)转为真正字符数组 - 中文范围粗筛:
/[\u4e00-\u9fa5]/u覆盖常用汉字,但缺扩展区(如「?」U+30000),严格场景建议用\p{Han}+/u
注意:\p{…} 语法必须配合 /u,否则语法错误;Node.js 需 ≥10.0,浏览器需现代环境(Chrome 64+、Firefox 78+)。
const regex = /\p{Emoji}\p{Extended_Pictographic}/u;
console.log(regex.test('?')); // true
console.log(regex.test('??')); // true(ZJW 序列也匹配)
复杂点在于:正则本身不解决语义,比如“手机号不能以 199 开头”得靠多条规则组合或后续 JS 判断;Unicode 属性类虽强大,但过度依赖会让正则难以调试和协作。先明确输入边界,再决定正则深度。










