
从 C++11 开始,标准库提供了 std::regex(定义在 头文件中),可用于模式匹配、查找、替换等操作。它语法接近 Perl 风格(ECMAScript 默认),但功能比 Boost.Regex 简化,且部分编译器(如早期 MSVC 或某些 libstdc++ 版本)实现不完整或性能较差,使用前建议确认标准库支持情况。
基本匹配:判断字符串是否符合模式
用 std::regex_match 检查整个字符串是否完全匹配正则表达式:
#include#include #include int main() { std::string s = "123-456-7890"; std::regex pattern(R"(\d{3}-\d{3}-\d{4})"); // 匹配电话格式 if (std::regex_match(s, pattern)) { std::cout << "格式正确\n"; } }
注意:regex_match 要求**全串匹配**;若只需子串匹配,应改用 regex_search。
查找子串:提取所有匹配内容
std::regex_search 可在字符串中查找第一个匹配;配合迭代器和 std::sregex_iterator 可遍历全部匹配:
立即学习“C++免费学习笔记(深入)”;
- 单次查找:传入
std::smatch获取捕获组和位置信息 - 批量提取:用
std::sregex_iterator遍历所有匹配项
示例:提取所有邮箱地址
std::string text = "联系我:a@b.com 或 x.y@domain.org";
std::regex email_pat(R"(\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b)");
auto begin = std::sregex_iterator(text.begin(), text.end(), email_pat);
auto end = std::sregex_iterator();
for (auto it = begin; it != end; ++it) {
std::cout << "找到邮箱:" << it->str() << "\n";
}
替换文本:简单替换与带捕获组的重构
std::regex_replace 返回替换后的新字符串(原字符串不变):
- 直接替换:将所有匹配替换为固定字符串
- 引用捕获组:用
$1、$2表示第 1、2 个括号内的内容
示例:把日期格式 YYYY-MM-DD 转成 DD/MM/YYYY
std::string date = "2023-12-25";
std::regex date_pat(R"((\d{4})-(\d{2})-(\d{2}))");
std::string result = std::regex_replace(date, date_pat, "$3/$2/$1");
// result == "25/12/2023"
常见注意事项与建议
正则在 C++ 中易出错,需特别留意:
- 转义字符要双重处理:C++ 字符串字面量中反斜杠需写为
\\,或使用原始字符串字面量(如R"(\d+)")避免干扰 - 异常安全:正则构造或匹配失败会抛出
std::regex_error,建议用 try/catch 包裹 - 性能考虑:频繁使用的正则应提前构造好
std::regex对象并复用,避免重复编译 - 兼容性提醒:GCC 4.9+、Clang 3.5+、MSVC 2015+ 支持较完整;旧版本可能缺少
regex_replace或 ECMAScript 功能
实际项目中若需更强大、稳定或跨平台的正则能力,可考虑 Boost.Regex 或 PCRE2 绑定,但对简单验证和解析,std::regex 已足够轻量可用。










