Pattern类用于编译正则表达式为可复用的模式对象,不直接匹配;匹配由Matcher实例执行;支持标志位、线程安全、静态快捷方法及转义处理。

Pattern 类是 Java 中用于编译和表示正则表达式的工具类,它本身不执行匹配操作,而是把字符串形式的正则表达式编译成可高效复用的内部模式对象。真正做匹配的是由它生成的 Matcher 实例。
Pattern 用来编译正则表达式
Java 不允许直接用字符串写正则去匹配,必须先用 Pattern.compile() 把正则字符串转成 Pattern 对象。这个过程会检查语法、优化结构,后续可重复使用该对象,避免反复编译开销。
- 推荐方式:
Pattern pattern = Pattern.compile("\\d{3}-\\d{4}"); - 带标志(如忽略大小写):
Pattern.compile("abc", Pattern.CASE_INSENSITIVE) - 如果正则固定且频繁使用,建议定义为
static final Pattern,提升性能
Pattern 提供便捷的静态匹配方法
虽然核心职责是编译,但 Pattern 也封装了几个常用快捷方法,省去手动创建 Matcher 的步骤:
-
pattern.matcher(str).find()→ 等价于pattern.matcher(str).find(),但更底层 -
pattern.matcher(str).matches()→ 全串匹配(等价于正则前后加 ^ 和 $) -
Pattern.matches(regex, str)→ 静态方法,适合一次性简单判断,例如Pattern.matches("\\d+", "123")
Pattern 支持编译选项和预编译复用
正则编译支持多种标志,比如多行模式、注释模式、Unicode 感知等,可在 compile() 时传入;更重要的是,Pattern 对象是线程安全的,可以被多个线程共享,适合在工具类或配置中预先定义好常用规则。
立即学习“Java免费学习笔记(深入)”;
- 常见标志:
Pattern.DOTALL(. 匹配换行符)、Pattern.MULTILINE(^$ 匹配每行起止) - 组合多个标志用按位或:
Pattern.compile("foo", Pattern.CASE_INSENSITIVE | Pattern.UNICODE_CASE) - 避免每次调用都
compile(),尤其在循环或高并发场景下
注意转义和字符串字面量的双重处理
Java 字符串本身会解析反斜杠,而正则又需要反斜杠作转义,所以写匹配反斜杠或特殊字符时要写两个反斜杠:"\\." 表示正则中的 \.(匹配点号),"\\\\\\" 才能匹配一个真正的反斜杠字符。
- 匹配数字:
"\\d+" - 匹配 Windows 路径分隔符:
"\\\\\\"或用Pattern.quote("\\")自动转义 - 不确定怎么转义时,优先用
Pattern.quote(str)包裹字面量字符串










