
本文介绍如何使用 python 遍历文本文件,精准定位并打印所有包含目标字符串的行及其行号,避免常见索引错误,提升代码健壮性与可读性。
在处理日志、配置或结构化文本(如无线接口能力输出)时,常需检索特定关键词(如 "AP/VLAN")出现的所有位置。原始代码虽能匹配,但使用 lines.index(line) 存在严重隐患:当文件中存在重复行时,index() 总返回首次出现的索引,导致行号错乱;同时 .find() != -1 的写法不如 in 运算符简洁直观。
推荐采用以下优化方案:
findString = "AP/VLAN"
with open('interfaces.txt', 'r', encoding='utf-8') as f:
for line_num, line in enumerate(f, start=1):
if findString in line:
print(f'String Found in Line Number: {line_num}')
print(f'Line Content: {line.rstrip()}')✅ 关键改进说明:
- 使用 enumerate(f, start=1) 直接按文件流逐行迭代,无需一次性读入全部内容(内存友好),且天然提供准确行号;
- line.rstrip() 替代 strip() 保留行首空格(如缩进的 * AP/VLAN),更忠实还原原始格式;
- 显式指定 encoding='utf-8' 避免中文或特殊字符环境下的解码异常;
- in 操作符语义清晰、性能优异,完全替代 .find() != -1。
⚠️ 注意事项:
立即学习“Python免费学习笔记(深入)”;
- 若需忽略大小写匹配,可改为 if findString.lower() in line.lower():;
- 若需匹配完整单词(避免 "AP/VLAN" 误匹配 "XAP/VLANX"),建议使用正则:import re 后 if re.search(r'\bAP/VLAN\b', line):;
- 对超大文件,此流式读取方式仍保持高效;切勿用 readlines() 加载 GB 级文件到内存。
综上,正确遍历 + 准确索引 + 安全编码,是实现可靠文本搜索的基础。一行代码的调整,即可规避隐蔽 bug,让脚本真正“所见即所得”。











