
本文介绍如何使用python高效遍历文本文件,精准定位并输出所有包含目标字符串的行及其行号,避免常见索引错误,提升代码健壮性与可读性。
在处理日志、配置或设备接口信息等结构化文本时,常需检索特定关键词(如 AP/VLAN)出现的所有位置。原始代码虽能匹配,但使用 lines.index(line) 存在严重隐患:当文件中存在重复行时,index() 总是返回该内容首次出现的行号,导致行号错乱;同时,.find() != -1 的写法不如 in 运算符简洁直观。
推荐采用以下优化方案:
findString = "AP/VLAN"
with open('interfaces.txt', 'r', encoding='utf-8') as f:
for line_num, line in enumerate(f, start=1):
if findString in line:
print(f'String Found in Line Number: {line_num}')
print(f'Line Content: {line.rstrip()}')✅ 关键改进说明:
- 使用 enumerate(f, start=1) 直接按文件流逐行迭代,无需一次性加载全部内容到内存(对大文件更友好),且天然提供准确行号;
- in 操作符语义清晰、性能良好,完全替代 .find() != -1;
- line.rstrip() 替代 strip() 保留行首空格(如缩进),仅移除末尾换行符和空白,更符合原始格式意图;
- 显式指定 encoding='utf-8' 避免跨平台读取乱码问题。
⚠️ 注意事项:
立即学习“Python免费学习笔记(深入)”;
- 若需不区分大小写匹配,可改用 if findString.lower() in line.lower():;
- 若目标字符串可能作为子串误匹配(如搜索 "AP" 却匹配到 "P2P-AP"),建议结合正则表达式使用单词边界 \bAP\b;
- 对超大文件(GB级),可考虑 mmap 或流式正则匹配进一步优化性能。
此方法简洁、可靠、符合Python惯用法,适用于绝大多数文本检索场景。











