在linux中,文本处理的三大利器grep、sed和awk在工作和面试中频繁出现。即使是复杂的需求,往往只需一条简单的命令就能解决。本文将重点介绍其中最强大的工具awk。
awk的概念及作用
awk是一种强大的文本处理工具,常用于处理和分析文本数据。其基本语法如下:
awk [options] 'BEGIN{ print "start" } ‘pattern{ commands }’ END{ print "end" }' file在awk中,BEGIN和END是关键字,必须大写,且为可选部分。BEGIN块在处理每行数据之前执行,END块则在处理完所有数据后执行,通常用于输出统计结果。

awk的基本语法也可以简化为:
awk [options] 'pattern{action}' {filenames}其中,pattern是匹配模式,表示awk在数据中查找的内容;action是找到匹配内容时执行的一系列命令。
awk匹配模式pattern参数

awk常用参数
-F:指定分隔符,默认使用空格进行分隔。 -V:赋值一个用户定义变量。
awk命令中常用的内置变量
n:如1、2、3,表示取第几列信息。 NF:表示当前记录的域的个数,即根据分隔符分割后的列数。 $NF:取最后一列。 $(NF-n):取倒数第几列。 $0:取所有列的信息。 FILENAME:awk浏览的文件名。 NR:行号。 RS:行分隔符,默认是换行。 FS:列分隔符,默认是空格和制表符。 OFS:输出列分隔符,用于打印时分割字段,默认为空格。 ORS:输出行分隔符,用于打印时分割记录,默认为换行符。
awk流程控制
{if(表达式){语句;语句;...}}
{if(表达式){语句;语句;...}else{语句;语句;...}}
{if(表达式){语句;语句;...}else if(表达式){语句;语句;...}else if(表达式){语句;语句;...}else{语句;语句;...}}学习案例:使用系统passwd文件进行演示

- 打印第一列
awk -F ':' '{print $1}' /etc/passwd
- 打印第二行的内容
awk -F ':' 'NR==2{print $0}' /etc/passwd
- 打印第5行到第10行的第1列
awk -F: '{if(NR>=5 && NR<=10) print $1}' /etc/passwd
- 指定多个分隔符
echo "abc:def/linux" | awk -F '[:/]' '{print $1","$2","$3}'
- 统计passwd文件每行的行号、列数、行内容
awk -F ':' '{print "行号:" NR ",列数:" NF ",行内容:"$0}' /etc/passwd
- 打印以mysql开头的行
awk '/^mysql/' /etc/passwd

- 过滤IP
ifconfig | awk '/broadcast/{print}' | awk -F " " '{print $2}'
- 统计/etc/passwd下的账户数
awk 'BEGIN {count=0;print "[start]user count is ", count} {count=count+1;print $0;} END{print "[end]user count is ", count}' /etc/passwd
- 打印字符串长度大于3的单词
echo "I am a teacher" |awk '{for(i=1;i<=NF;i++) if(length($i)>3) print $i}'









