gawk 语法:
gawk ‘script’ files
gawk script如下所示:
/pattern/ { actions }
gawk 语法:
gawk ‘script’ files
gawk script如下所示:
/pattern/ { actions }
假定fruit.txt文件的内容如下:
Fruit Frice/lbs Quantity
Banana $0.89 100
Peach $0.79 65
Kiwi $1.50 22
Pineapple $1.29 35
Apple $0.99 78
例7-1. 相对于数据文件fruit.txt的一组示例
输出所有内容
1). gawk ‘{ print ; }’ fruit.txt
输出指定字段
2). gawk ‘{ print $1,$3 ; }’ fruit.txt
以特定格式输出指定字段
3). gawk ‘{ printf "%-15s %s",$1,$3 ; }’ fruit.txt
在模式中使用正则表达式
4). gawk ‘ /\$[1-9][0-9]*\.[0-9[0-9]*/ {print $1,$2,$3;} /\$0\.[0-9][0-9]*/{prints ; } ‘ fruit.txt
在模式中使用关系表达式
5). gawk ‘$3<=75 { printf "%s%t%s\n",$0,"REORDER" ; } $3>75 print $0; ‘ fruit.txt
在模式中使用匹配、正则表达式、关系表达式、逻辑表达式样
6). gawk ‘($2 ~ /^\$[1-9][0-9]*\.[0-9][0-9]$/) && ($3<75){ printf "%s%t%s%t%s",$0,"*","REORDER" ; }’ fruit.txt
查看IP地址
7). ifconfig | gawk ‘/inet/{print $2}’ | gawk -F: ‘{print $2}’
数据文件employees的内容如下:
Tom Jones 4424 5/12/66 543354
Mary Adams 5346 11/4/63 28765
Sally Chang 1645 7/22/54 650000
Billy Black 1683 9/23/44 336500
例7-2. 关于数据文件employees的一组例子
模式匹配
1). gawk ‘/Sally/{print $1,$2}’ employees
gawk的数据来源于管道
2). df | gawk ‘$4>75000{print}’
3). rusers | gawk ‘/root$/{print $1}’
4). date | gawk ‘{print "Month:" $2 "\nYear:",$6}’
利用-F选项指定字段分隔符
5). gawk -F: ‘/Tom Jones/{print $1,$2}’ employees
6). gawk -F'[ :\t]’ ‘{print $1,$2}’ employees
使用"~"针对某个字段进行模式匹配
7). gawk ‘$1 ~ /[Bb]ill/{print $0}’ employees
8). gawk ‘$1 !~ /ly$/{print $0}’ employees
9). gawk ‘$2 ~ /E/{print $1,$2}’ employees
在模式,或字段模式中使用正则表达式
10). gawk ‘/^[ns]/{print $1}’ employees
11). gawk ‘$5 ~ /\.[7-9]+/{print $0}’ employees
在操作中使用条件表达式
12). gawk ‘{m=($1>$2)?$1:$2 ;print m}’ employees
如果第一和第二个域相加大于100,则打印这些行。
13). gawk ‘$1 + $2 < 100’ test
如果第一个域大于5,并且第二个域小于10,则打印这些行。
14). gawk ‘$1 > 5 && $2 < 10’ test
gawk函数
15). gawk ‘NR==1 {gsub(/northwest/,"southeast",$1);print}’ test
16). gawk ‘{print substr($3,1,3);print length($3)}’ employees
17). gawk ‘{print index($1,"ao")}’ employees
18). gawk ‘BEGIN{split("10/14/2001",now,"/");print now[1],now[2],now[3]}’ test
读输入(getline)
19). gawk ‘BEGIN{while(getline < "/etc/passwd" >0) {lc++} print lc}‘ datafile
例7-3. 输出多个文件(由命令行参数指定)中空行数目
#!/bin/bash
for i in $@
do
if [ -f $i ];then
echo $i
gawk ‘/^ *$/ { x=x+1; print x; }’ $i
else
echo "Error $i is not a file" >&2
fi
done
例7-4. 输出多个文件(由命令行参数指定)中空行数目–只输出一次(在gawk中使用END)
#!/bin/bash
for i in $@
do
if [ -f $i ];then
echo "$i\c"
gawk ‘/^ *$/ { x=x+1; next; } END {printf "%s\n",x; }’ $i
else
echo "Error $i is not a file" >&2
fi
done
例7-5. 订购数量在75以下的货物,并在单价高于1元的货物后加上"*"(在gawk中使用if条件)
awk ‘{
printf "%s\t",$0;
if($2 ~ /\$[1-9][0-9]*\.[0-9][0-9]/) {
printf "*";
if($3<=75) {
printf "REORDER\n";
}else{
printf "\n";
}
}else {
if ($3<75) {
printf "REORDER\n";
}else{
printf "\n";
}
}
}’ fruit.txt
例7-6. 将文件各行字段按相反的顺序输出(在gawk中使用while循环)
#!/bin/bash
gawk ‘{ x=NF;
while (x>0)
{
printf("%16s",$x);
x-=1;
}
print " ";
}’ fruit.txt
例7-7. 将文件各行字段按相反的顺序输出(在gawk中使用for循环)
#!/bin/bash
gawk ‘{
for (x=1;x<=NF;x+=1)
{
printf "%s", $x;
}
printf "\n";
}’ fruit.txt
例7-8: gawk脚本1
脚本文件gawkfile文件的内容如下:
/^Mary/{print "Hello Mary!"}
{print $1,$2,$3}
执行脚本文件中的操作,可采用:
# gawk -f gawkfile employeess
例7-9: 对记录进行多种操作
利用gawk脚本对/etc/passwd文件进行数据合法性检验(如果字段数不等于7,或字段1不包含任何字母和数字字符,或字段2是一个*,则输出相应的提示信息).
# cat /etc/passwd | gawk -F: ‘\
NF!=7 {printf("line %d,does not have 7 fields:%s\n",NR,$0)} \
$1 !~ /[A-Za-z0-9]/{printf("line %d:nonealphanumeric user id:%s\n",NR,$0)} \
$2 == "*" {printf("no password: %s\n",$0)}’
例7-10: 数组初步
1. 将文件employees中第二个字段的值保存在数组name中,并输出.
gawk ‘{name[x++]=$2};END{for(i=0;i<NR;i++) \
print i,name[i]}’ employees
2.将文件employees中第三个字段的值保存在数组id中,并输出(使用字段下标的形式).
gawk ‘{id[NR]=$3};END{for(x=1;x<=NR;x++) \
print id[x] }’ employees
3.将文件employees中第三个字段的值保存在数组id中,并输出(使用for in形式).
gawk ‘{id[NR]=$3};END{for(x in id) \
print id[x] }’ employees
4. gawk ‘BEGIN{ numelements=split("Jan,Feb,Mar,Apr,May,Jun,Jul,Aug,Sep,Oct,Nov,Dec",mymonths,",")};\
END{for(x in mymonths) \
print mymonths[x] }} ‘
例7-11: 自定义函数
#!/usr/bin/env awk -f
BEGIN {
FS="\t+"
months="Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec"
}
function monthdigit(mymonth) {
return (index(months,mymonth)+3)/4
}
END{
print monthdigit("Mar")
}
例7-12: 脚本文件与自定义函数
针对练习中的数据文件,编写一个用户自定义函数,要求函数能返回指定月份的人均捐款数额,月份由命令行传入
#cat awkf
BEGIN {
total=0
n=0
}
function mon_avg(curmonth) {
curmonth=4+curmonth
total+=$curmonth
n++
return total/n;
}
{
x=mon_avg(argv[1])
}
END{
print "The end is",x
}
#gawk -f awkfile datafile
例7-13: 批量添加系统用户
这个脚本还有很多地方需要改进,比如算法,比如数据的处理。
希望大家不吝提出修改意见。
[code:1:22892b664a]
#!/bin/sh
# Name: useraddmuti
# Descripton: To add users to your system. Users can be list in a file.
# To exec this command your ID must be 0.
# Author: PopZslam@Linux.net
#———————————–
chkUID(){
getUID(){
id|sed -e ‘s/(.*$//’ -e ‘s/^uid=//’
}
if [ "`getUID`" -ne 0 ]
then
echo -e "\tYou are not root!"
exit 0
fi
}
chkUID
usagePRT(){
echo ${USAGE:=’USAGE:’ `basename $0` ‘-f namelistfile’}
}
chkFILE(){
if [ ! -z "`awk ‘NF!=2{print NF;exit;}’ $1`" ] && [ "`awk ‘NF!=2{print NF;exit;}’ $1`" -ne 2 ] ; then
echo -e "The file’s format is not right!"
exit 0
fi
}
userCHK(){
for USER in `awk ‘{print $1;}’ $1`
do
if grep -wq $USER /etc/passwd ; then
echo -e "The user($USER) has been added!"
exit 1
fi
if echo $USER|grep -wq "^[0-9].*" ; then
echo -e "The user($USER)’s name is wrong format!"
exit 1
fi
done
}
setOPT(){
echo -e "Now Let’s set some options or you can use default settings."
setGRPNAME(){
while :
do
echo -e "Would you like to add a new group to add these users to it?"
echo -e "Enter YES to create a new group otherwise you must verify the group."
printf "Your Answer: "
read grpopt
case $grpopt in
yes)
printf "Please enter the group’s name: "
read grpoptnew
if cat /etc/group|sed ‘s/:.*//’|grep -wq $grpoptnew ; then
echo "The group’s name($grpoptnew) exist."
exit
else
grpname=$grpoptnew
echo -e "All these users will be added to group($grpname)…"
echo -e "Adding group …"
if cp /etc/group /etc/group.$$ > /dev/null 2>&1 ; then
if groupadd $grpname ; then
echo -e "The group($grpname) is added!"
rm -f /etc/group.$$
break 1
else
echo -e "There’s something wrong when adding the group($grpname)."
echo -e " *** Please recovered the group file. *** "
echo -e "You can cp /etc/group.$$ to /etc/group to recover."
fi
else
echo "Error! Please check the program or your disk space."
exit 0
fi
fi
;;
*) : ;;
esac
done
}
setGRPNAME
}
addUSER(){
if cp /etc/passwd /etc/passwd.$$ && cp /etc/shadow /etc/shadow.$$ ; then
for user in `sed ‘s/ .*//’ $1`
do
pass=`awk ‘{
$1~/$name/
{print $2;exit}
} name=$user’ $1`
if [ -z "$pass" ] ; then
echo -e "The passwd is used by default sun123."
pass=sun123
fi
if [ ${#pass} -lt 6 ] ; then
echo -e "The user($user)’s password is too short!"
echo -e "Use default password: sun123."
pass=sun123
fi
if useradd $user ; then
echo -e "The user($user) is added."
if echo $pass|passwd $user –stdin > /dev/null 2>&1 ; then
echo -e "The user($user)’s password is setted!"
else
echo -e "The user($user)’s password is NOT set!"
fi
else
echo -e "The user($user) is NOT add."
fi
done
rm -f /etc/passwd.$$ /etc/shadow.$$
else
echo -e "There something wrong when backup the passwd and shadow file."
fi
}
if [ $# -ne 2 ] ; then
usagePRT
exit 0
fi
case "$1" in
-f)
if [ -f "$2" ] ; then
echo -e "Reading usernamelist file""("$2")" "…"
chkFILE $2
userCHK $2
setOPT
addUSER $2
else
echo -e "There’s no usernamelist file!"
fi
;;
*) usagePRT
exit 0
;;
esac
附:获取不同操作系统下的IP地址
#!/bin/sh
# Shell script scripts to read ip address
# ————————————————————————-
# Copyright (c) 2005 nixCraft project <http://cyberciti.biz/fb/>
# This script is licensed under GNU GPL version 2.0 or above
# ————————————————————————-
# This script is part of nixCraft shell script collection (NSSC)
# Visit http://bash.cyberciti.biz/ for more information.
# ————————————————————————-
# Get OS name
OS=`uname`
IO="" # store IP
case $OS in
Linux) IP=`ifconfig | grep ‘inet addr:’| grep -v ‘127.0.0.1’ | cut -d: -f2 | awk ‘{ print $1}’`;;
FreeBSD|OpenBSD) IP=`ifconfig | grep -E ‘inet.[0-9]’ | grep -v ‘127.0.0.1’ | awk ‘{ print $2}’` ;;
SunOS) IP=`ifconfig -a | grep inet | grep -v ‘127.0.0.1’ | awk ‘{ print $2} ‘` ;;
*) IP="Unknown";;
esac
echo "$IP"
练习:
有数据文件内容如下:
Mike Harrington:(510) 548-1278:250:100:175
Chrstian Dobbins:(408) 538-2358:155:90:201
Susan Dalsass:(206) 548-1348:250:60:50
Archie McNichol:(206) 654-6279:250:100:175
Jody Savage:(206) 548-1278:15:188:150
Guy Quigley:(916) 343-6410:250:100:175
Dan Savage:(406) 298-7744:450:300:275
Nancy McNeil:(206) 548-1278:250:80:75
John Goldenrod:(916) 348-4278:250:100:175
Chet Main:(510) 548-5258:50:95:135
Tom Savage:(408) 926-3456:250:168:200
Elizabeth Stachelin:(916) 440-1763:175:75:300
各行记录内容包括姓名、电话号码和最近3个月的捐款数额。
针对上述文件,使用gawk完成下列操作:
1. 打印所有电话号码
2. 打印Dan的电话号码
3. 打印Susan的姓名和电话号码
4. 打印所有以D开头的姓( gawk -F: ‘/^D/ {split($1,name," ");print name[2]}’ datafile)
5. 打印所有以C或E开头的名
6. 打印所有只有4个字母的姓
7. 打印所有916区的人的姓
8. 打印Mike的捐款数额,打印时每个值都要以美元符号开头.
9. 先打印姓,然后打印一个逗号,再打印名
10. 写下一个名为facts的awk脚本,完成以下操作:打印Savages的全名和电话号码;打印Chet的捐款数额;打印所有第一个月捐款250元的人.
11. 打印在第一个月捐款超过100元的人的姓名。
12. 打印在第一个月捐款少于60元的人的姓名和电话号码。
13. 打印在第三个月捐款额在90元到150元之间的人。
14. 打印在这三个月捐款总额超过800元的人。
15. 打印不在916区的人的姓.
16. 打印月均捐款额大于150元的人的姓名和电话号码.
17. 打印每条记录,并在记录前加上其记录号
18. 打印每个人的姓名和捐款总额
19. 把Elizabeth第二个月的捐款额加上10
20. 把Nancy McNeil的名字改成Louise McInnes
21. 编写一个用户自定义函数,要求函数能返回指定月份的人均捐款数额,月份由命令行传入.
22. 编写一个gawk程序对文件中的每行编号,然后将它的输出发送到标准输出.
23. 编写一个gawk程序,显示第1个字段中的字符数目,及第一个字段的内容.
24.使用gawk来判断/etc/termcap中有多少行包含了字符串vt100.并使用grep验证一下自己的程序.
参考答案:
1. 打印所有电话号码
gawk -F: ‘{ print $2; }’ awk2.sh
或
gawk -F: ‘{ printf("%s\n", $2); }’ awk2.sh
2. 打印Dan的电话号码
gawk -F: ‘/Dan/{ print $2; }’ awk2.sh
3. 打印Susan的姓名和电话号码
gawk -F: ‘/Susan/{ print $1,$2; }’ awk2.sh
4. 打印所有以D开头的姓
gawk ‘{printf("%s %s\n", $1,$2)}’ awk2.sh | gawk ‘$2~/^D/{print $2}’
5. 打印所有以C或E开头的名
gawk ‘$1~/^[CE]/{print $1}’ awk2.sh
6. 打印所有只有4个字母的姓
gawk -F: ‘{print $1}’ awk2.sh | gawk ‘$2 ~/^….$/{print $2}’
或
7. 打印所有916区的人的姓
gawk -F: ‘$2~/(916)/ {split($1,x," ");print x[2]}’ datafile
或:
gawk -F: ‘$2~/(916)/ {print $1}’ datafile | gawk ‘{print $2}’
8. 打印Mike的捐款数额,打印时每个值都要以美元符号开头.
gawk -F: ‘$1~/Mike/ {printf("$%d,$%d,$%d\n", $3,$4,$5)}’ datafile
9. 先打印姓,然后打印一个逗号,再打印名
gawk -F: ‘split($1,x," ") {printf("%s,%s\n",x[2],x[1])}’ datafile
10. 写下一个名为facts的awk脚本,完成以下操作:打印Savages的全名和电话号码;打印Chet的捐款数额;打印所有第一个月捐款250元的人.
脚本的facts内容如下:
BEGIN{
FS=":"
}
$1 ~ /Savages/ {print $1,$2}
$1 ~ /Chen/ {print $1,$3,$4,$5}
$3==250 {print $1,$2}
按下面的方式执行脚本
gawk -f facts datafile
11. 打印在第一个月捐款超过100元的人的姓名。
gawk -F: ‘$3>100{print $1}’ awk2.sh
12. 打印在第一个月捐款少于60元的人的姓名和电话号码。
gawk -F: ‘$3<60 {print $1,$2}’ awk2.sh
13. 打印在第三个月捐款额在90元到150元之间的人。
gawk -F: ’90<=$5 && $5<=150 {print $1}’ awk2.sh
14. 打印在这三个月捐款总额超过800元的人。
gawk -F: ‘$3+$4+$5>800 {print $1}’ awk2.sh
15. 打印不在916区的人的姓.
gawk -F: ‘$2!~916 {split($1,nn," "); print nn[2]}’ datafile
或
gawk -F: ‘$2!~916 {print $1}’ datafile | gawk ‘{print $2}’
16. 打印月均捐款额大于150元的人的姓名和电话号码.
gawk -F: ‘$3+$5+$4>450 {print $1,$2}’ datafile
17. 打印每条记录,并在记录前加上其记录号
gawk ‘{print NR" "$0}’ awk2.sh
18. 打印每个人的姓名和捐款总额
gawk -F: ‘{print $1,$3+$4+$5;}’ awk2.sh
19. 把Elizabeth第二个月的捐款额加上10
gawk ‘$1~/Elizabeth/ {$4=$4+10;print $0;}’ datafile
20. 把Nancy McNeil的名字改成Louise McInnes
gawk -F: ‘$1 ~ /Nancy McNeil/{gsub("Nancy McNeil","Louise McInnes",$1);print}’ awk2.sh
21. 编写一个用户自定义函数,要求函数能返回指定月份的人均捐款数额,月份由命令行传入.
脚本应按如下方式执行:
gawk -f awk3.sh -v m=0 awk2.sh
脚本awk3的内容如下:
BEGIN{
FS=":"
r=0
n=0
}
function mon_tot(curmonth)
{
r+=$(2+m)
n++
return r
}
x=mon_tot(m){}
END{
printf("month%d:average denotion is %s\n",m, x/n)
}
22. 编写一个gawk程序对文件中的每行编号,然后将它的输出发送到标准输出.
gawk ‘{print NR" "$0}’ awk2.sh
23. 编写一个gawk程序,显示第1个字段中的字符数目,及第一个字段的内容.
gawk -F: ‘{print length($1),$1}’ awk2.sh
24.使用gawk来判断/etc/termcap中有多少行包含了字符串vt100.并使用grep验证一下自己的程序.
gawk ‘BEGIN{n=0} /vt100/{n++} END{print n}’ /etc/termcap
grep -c vt100 /etc/termcap