首先读取文件内容,再结合正则表达式匹配目标。使用file_get_contents()或逐行读取处理文本,通过strpos()搜索关键词,preg_match_all()提取邮箱等结构化信息,并可用glob()遍历多文件搜索,适用于日志分析与代码扫描。

在PHP中执行文件内容搜索,尤其是结合正则表达式进行匹配,是处理日志分析、代码扫描或文本提取时的常见需求。你可以使用PHP内置函数读取文件内容,再通过正则函数进行模式匹配。
读取文件内容并搜索关键词
要搜索文件中的特定内容,首先需要将文件读入字符串。常用函数包括 file_get_contents() 或逐行读取的 fopen() + fgets()。对于大文件,建议逐行处理以节省内存。
示例:搜索包含“error”的行- 使用 file() 将文件按行读入数组
- 遍历每一行,用 strpos() 判断是否包含目标字符串
代码示例:
$lines = file('log.txt', FILE_IGNORE_NEW_LINES);
foreach ($lines as $line) {
if (strpos($line, 'error') !== false) {
echo "找到匹配行: $line\n";
}
}
使用正则表达式匹配复杂模式
当需要匹配邮箱、IP地址、时间戳等结构化内容时,正则表达式更灵活。PHP提供 preg_match() 和 preg_match_all() 函数。
立即学习“PHP免费学习笔记(深入)”;
示例:提取所有邮箱地址- 读取整个文件内容
- 使用 preg_match_all() 匹配邮箱正则
- 输出所有匹配结果
代码示例:
$content = file_get_contents('document.txt');
$pattern = '/[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}/';
preg_match_all($pattern, $content, $matches);
if (!empty($matches[0])) {
foreach ($matches[0] as $email) {
echo "发现邮箱: $email\n";
}
}
处理多文件或目录搜索
若需在多个PHP文件中搜索特定模式(如查找所有调用某个函数的地方),可结合 glob() 遍历文件。
- 使用 glob("*.php") 获取所有PHP文件
- 对每个文件逐行或全文进行正则匹配
- 输出文件名和匹配内容
示例:查找所有含 mysql_query() 的文件(用于升级到PDO前的扫描)
$files = glob("*.php");
foreach ($files as $file) {
$content = file_get_contents($file);
if (preg_match('/\bmysql_query\s*\(/', $content)) {
echo "在 $file 中发现旧式数据库调用\n";
}
}
基本上就这些。掌握文件读取与正则匹配的组合,能高效完成各种内容搜索任务。注意合理使用内存,避免一次性加载超大文件。











