std::regex是C++中用于正则表达式的标准库工具,提供regex_match全匹配、regex_search子串搜索、regex_replace替换及捕获组提取功能,需包含头文件,支持常用正则语法,建议使用较新GCC或Clang版本以确保兼容性。

在C++中,std::regex 是标准库中用于处理正则表达式的工具,定义在
包含头文件与基本组件
使用 std::regex 需要包含头文件:
主要类包括:
- std::regex:编译后的正则表达式对象
- std::smatch:用于存储字符串匹配结果(std::string 版本)
- std::regex_match:判断整个字符串是否匹配模式
- std::regex_search:在字符串中查找符合模式的子串
- std::regex_replace:替换匹配到的内容
regex_match:完全匹配
std::regex_match 要求整个字符串完全符合正则表达式模式。
立即学习“C++免费学习笔记(深入)”;
示例:验证一个简单的数字字符串
#include#include #include int main() { std::string text = "12345"; std::regex pattern(R"(\d+)"); // 匹配一个或多个数字 if (std::regex_match(text, pattern)) { std::cout << "完全匹配成功\n"; } else { std::cout << "不匹配\n"; } return 0; }
输出:
完全匹配成功若 text 为 "abc123",则不会匹配,因为不是全由数字组成。
regex_search:查找子串匹配
std::regex_search 用于在字符串中查找是否存在符合模式的子串。
示例:从文本中查找第一个数字序列
#include#include #include int main() { std::string text = "我的电话是 123456789,记得哦!"; std::regex pattern(R"(\d+)"); std::smatch match; if (std::regex_search(text, match, pattern)) { std::cout << "找到数字: " << match.str() << "\n"; } return 0; }
输出:
找到数字: 123456789match 是一个 smatch 对象,match.str() 返回匹配的子串。
提取分组信息
使用括号 () 可以定义捕获组,提取特定部分。
示例:提取日期中的年月日
#include#include #include int main() { std::string date = "2024-04-05"; std::regex pattern(R"((\d{4})-(\d{2})-(\d{2}))"); std::smatch match; if (std::regex_match(date, match, pattern)) { std::cout << "年: " << match[1] << "\n"; std::cout << "月: " << match[2] << "\n"; std::cout << "日: " << match[3] << "\n"; } return 0; }
输出:
年: 2024月: 04
日: 05
match[0] 是完整匹配,match[1], match[2], match[3] 对应各捕获组。
regex_replace:替换匹配内容
std::regex_replace 将匹配的部分替换为指定字符串。
示例:将所有连续空格替换为单个空格
#include#include #include int main() { std::string text = "a b c"; std::regex pattern(R"( +)"); std::string result = std::regex_replace(text, pattern, " "); std::cout << result << "\n"; // 输出: a b c return 0; }
也可以结合捕获组进行复杂替换:
std::string name = "John Doe"; std::regex name_pattern(R"((\w+) (\w+))"); std::string reversed = std::regex_replace(name, name_pattern, "$2, $1"); // 结果: "Doe, John"
$1, $2 分别引用第一、第二个捕获组。
基本上就这些常用操作。std::regex 支持大多数常见正则语法,如 \d, \w, *, +, ?, ., ^, $ 等。注意不同编译器对正则的支持程度略有差异,建议使用较新版本的 GCC 或 Clang 以获得更好兼容性。











