Linux 开发：如何用 sed / awk 做文本处理 (日志 / 配置)

冷炫風刃

发布时间：2025-11-18 21:39:05

294人浏览过

来源于php中文网

原创

sed和awk是Linux日志与配置处理的核心工具：sed用于文本替换、删除等行操作，如修改配置项或清理注释；awk擅长字段化分析，可提取IP、统计状态码、汇总请求；二者结合可实现清洗后分析，如sed过滤调试日志后由awk统计错误类型，配合正则与分隔符支持，能高效完成自动化文本处理任务。

linux 开发：如何用 sed / awk 做文本处理 (日志 / 配置)

在 Linux 开发中，处理日志和配置文件是日常任务。sed 和 awk 是两个强大的文本处理工具，适合自动化、高效地完成提取、替换、过滤等操作。下面介绍它们在实际场景中的用法。

sed：流编辑器，擅长文本替换与行操作

sed 以行为单位处理文本，常用于修改、删除、插入内容，特别适合批量处理配置文件或清洗日志。

常见用途：

替换字符串（如修改配置项）
删除注释行或空行
提取特定行

示例：

# 将配置文件中的 port=8080 替换为 port=9000

sed -i 's/port=8080/port=9000/' config.conf

# 删除所有以 # 开头的注释行和空行

sed -i '/^#/d;/^$/d' app.log

# 显示包含 ERROR 的行，并打印前后各 2 行

sed -n '/ERROR/-2,+2p' system.log

awk：数据提取与结构化分析利器

awk 按字段解析文本，适合从日志中提取关键信息，比如时间、IP、状态码等。它把每行看作一组字段，默认以空白分隔。

常用场景：

统计访问量、错误次数
格式化输出日志摘要
条件过滤并计算

示例：

# 提取 Nginx 日志中的 IP 地址（第一列）

awk '{print }' access.log

DeepSeek

幻方量化公司旗下的开源大模型平台

下载

# 统计 HTTP 状态码 404 出现次数

awk '$9 == 404 {count++} END {print count+0}' access.log

# 找出请求超过 1 秒的行（假设第 10 字段是响应时间）

awk '$10 > 1 {print $1, $7, $10}' access.log

# 按用户 IP 汇总请求数

awk '{ip[$1]++} END {for (i in ip) print i, ip[i]}' access.log

组合使用：sed 预处理 + awk 分析

真实场景中，可以先用 sed 清理数据，再交给 awk 处理。

# 去掉日志中的调试信息，然后统计错误类型

sed '/DEBUG/d' app.log | awk '/ERROR/ {err[$NF]++} END {for(e in err) print e, err[e]}'

# 提取 Apache 日志中特定日期的访问，并按 URL 排序计数

sed -n '/10\/May\/2024/p' access.log | awk '{url[$7]++} END {for(u in url) print url[u], u}' | sort -nr

小技巧与注意事项

sed 使用 -i 修改文件前建议先测试，可加 .bak 备份：sed -i.bak 's/old/new/' file
awk 支持自定义分隔符，如 CSV 文件可用 -F','
正则表达式在两者中都支持，但语法略有不同，注意转义
对于复杂逻辑，优先考虑脚本化（写成 shell 脚本），提高可维护性

基本上就这些。掌握 sed 和 awk 的基本模式后，处理日志和配置会变得非常高效。不复杂但容易忽略的是多练习实际例子，熟悉字段结构和匹配逻辑。

Linux容器安全教程_Docker容器加固与镜像管理

LinuxCPU内存优化项目教程_多核利用与内存管理实践

Linux多线程与多进程运维教程_ShellPython调度优化

Linux命令行思维如何建立_高效操作方法说明【指导】

LinuxShell参数处理方法_脚本灵活性解析【教程】

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Linux 运维：如何使用 alias 命令提高日常操作效率下一篇：Linux 运维：如何执行裸机恢复 (bare-metal restore)

作者最新文章

mcjs怎么开创造_MCJS网页版切换创造模式方法详解

2026-01-10 08:01

如何将文件传输到 Windows 远程桌面

2026-01-10 09:03

劳动仲裁需要多少个工作日_劳动仲裁受理后一般45日内裁决复杂可延15日

2026-01-10 09:19

天猫超市和天猫有什么区别？天猫和天猫超市哪个好

2026-01-10 09:36

python怎么显示行号

2026-01-10 10:03

红米手机无限重启自救方法_红米手机无限重启恢复模式修复

2026-01-10 10:19

Python数据库操作教程_SQLiteMySQL连接使用

2026-01-10 10:49

百度网盘提取码入口网页版_百度网盘分享链接提取码输入指南

2026-01-10 10:52

京东全球购是什么意思？京东自营全球购可信吗

2026-01-10 12:04

截至2026年1月iOS 26普及率仅15% 创4年来最低值

2026-01-10 12:39

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

nginx 重启

nginx重启对于网站的运维来说是非常重要的，根据不同的需求，可以选择简单重启、平滑重启或定时重启等方式。本专题为大家提供nginx重启的相关的文章、下载、课程内容，供大家免费下载体验。

229

2023.07.27

nginx 配置详解

Nginx的配置是指设置和调整Nginx服务器的行为和功能的过程。通过配置文件，可以定义虚拟主机、HTTP请求处理、反向代理、缓存和负载均衡等功能。Nginx的配置语法简洁而强大，允许管理员根据自己的需要进行灵活的调整。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

495

2023.08.04

nginx配置详解

NGINX与其他服务类似，因为它具有以特定格式编写的基于文本的配置文件。本专题为大家提供nginx配置相关的文章，大家可以免费学习。

498

2023.08.04

tomcat和nginx有哪些区别

tomcat和nginx的区别：1、应用领域；2、性能；3、功能；4、配置；5、安全性；6、扩展性；7、部署复杂性；8、社区支持；9、成本；10、日志管理。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

227

2024.02.23

nginx报404怎么解决

当访问 nginx 网页服务器时遇到 404 错误，表明服务器无法找到请求资源，可以通过以下步骤解决：1. 检查文件是否存在且路径正确；2. 检查文件权限并更改为 644 或 755；3. 检查 nginx 配置，确保根目录设置正确、没有冲突配置等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

332

2024.07.09