linux shell中使用awk sed等命令

9,023次阅读

共计 3107 个字符，预计需要花费 8 分钟才能阅读完成。

cut 命令不能在分割符是空格的字符串中截取列，只能是制表符或具体的分割符。

-b ：仅显示行中指定直接范围的内容；
-c ：仅显示行中指定范围的字符；
-d ：指定字段的分隔符，默认的字段分隔符为”TAB”；
-f ：显示指定字段的内容；
-n ：与”-b”选项连用，不分割多字节字符；
--complement ：补足被选择的字节、字符或字段；
--out-delimiter=<字段分隔符> ：指定输出内容是的字段分割符；
--help ：显示指令的帮助信息；
--version ：显示指令的版本信息。

-d :分隔符（ --delimiter 按照指定分隔符分割列）
-b : 表示字节
-c : 表示字符
-f : 表示字段(列号) （ --field 提取第几列）
N- : 从第N个字节、字符、字段到结尾
N-M : 从第N个字节、字符、字段到第M个
-M : 从第一个字节、字符、字段到第M个

 $> cat user.txt
01, zhang, M, 18
02, wang, M, 20
03, li, M, 21
# 以","分隔，显示第二列
$> cut -d "," -f 2 user.txt
 zhang
 wang
 li
# 以","分隔，显示第1列和第3列
$> cut -d "," -f 1,3 user.txt
01, M,
02, M,
03, M,
# 以","分隔，显示第1-3列
$> cut -d "," -f 1-3 user.txt
01, zhang, M,
02, wang, M,
03, li, M,
# 以","分隔，显示除第1列以外的其他列
$> cut -d "," -f 1 --complement user.txt
 zhang, M, 18
 wang, M, 20
 li, M, 21
## 注意前面是有空格的！
###### 字符串
$> cut -c1-5 user.txt
01, zh
02, wa
03, li

printf ‘输出类型输出格式’ 内容

– %ns: 输出字符串。n是数字，指输出几个字符
– %ni: 输出整数。n是数字，指输出几个数字
– %m.nf: 输出浮点数。m和n是数字，分别指输出的整数位数和小数位数。如%8.2f代表共输出8位数，其中2是小数，6是整数。

– \a : 输出警告声音
– \b : 输出退格键，也就是Backspace键
– \f : 清除屏幕
– \n : 换行
– \r : 回车，也就是Enter键
– \t : 水平输出退格键，也就是Tab键
– \v : 垂直输出退格键，也就是Tab键

 printf %s 1 2 3 4 5 6 # 把123456当成一个字符串输出，没有格式
printf %s %s %s 1 2 3 4 5 6 # 把%s%s123456当做字符串输出，没有格式
printf '%s ' 1 2 3 4 5 6 # 把1 2 3 4 5 6当做字符串输出，输出格式为空格
printf '%s\n' 1 2 3 4 5 6 # 输出格式为1个一行
printf '%s %s %s' 1 2 3 4 5 6 # 把内容当做字符串三个为一组输出，1 2 34 5 6
printf '%s %s %s\n' 1 2 3 4 5 6 # 输出格式为3个一行
printf '%s' (cat user.txt) # 输出文本内容为字符串
printf '%s\t %s\t %s\t %s\n'(cat user.txt)　　# 把文本内容格式化输出

建议 man printf 查看可用的输出格式，和C的 printf 格式一样。

awk ‘条件1{动作1} 条件2{动作2} …’ 文件名
（如果条件1，执行动作1；如果条件2，执行动作2 ）

x > 10 : 判断变量x是否大于10
x >= 10 : 大于等于
x <= 10 : 小于等于

格式化输出
流程控制语句

 # 大括号前面没有条件，直接执行命令，这里的printf 是awk的命令，2 提取文件第二列，3 提取文件第三列，0 提取所有列
awk '{printf2 "\t" 3"\n"}' user.txt
 
# 打印三列，这里的print是awk的命令，系统并没有print命令，所以只能在awk里使用；与printf的区别是：print会自动在行尾加换行符，而printf不会
df -h | awk '{print1 "\t" 5 "\t"6 "\t"}'
 
# 提取系统已使用硬盘空间，可以把结果赋给一个变量，判断是否大于某个值，进行报警
df -h | grep sda3 | awk '{print 5}' | cut -d '%' -f 1
 
# 查看剩余内存不包含单位M
free -h | grep Mem | awk '{print4}' | cut -d 'M' -f 1

grep 取行，awk 按条件取指定列，cut 按分隔符取指定列。
BEGIN：先执行一条多余的动作

awk 'BEGIN{print "this is a text"} {print 2 "\t"3}' user.txt

END：用于在所有命令处理完之后执行
FS内置变量：用于定义分割符，如果需要手工定义分割符，一定要在分割符前面加BEGIN；

awk 'BEGIN{FS=":"} END{print "this is end text"} {print 1 "\t"3}' /etc/passwd

BEGIN、END也是条件。
关系运算符：

 # user.txt中不包含ID这行，提取满足条件为第四列值大于18的第二列
cat user.txt | grep -v ID | awk '4>18 {printf2 "\n"}'

sed主要是用来将数据进行选取、替换、删除、新增的命令。可以放在管道符之后处理。

sed [选项] ‘[动作]’ 文件名
sed命令有两种形式：sed [options] ‘command’ file(s)；sed [options] -f scriptfile file(s)

-n : 一般sed命令会把所有数据都输出到屏幕；如果加入此选项，则只会把经过sed命令处理的行输出到屏幕。
- sed -n '2p' user.txt # 输出第二行
-e : 允许对输入数据应用多条sed命令编辑
-f : 添加脚本文件的内容到执行的动作
-i : 用sed的修改结果直接修改读取数据的文件，而不是由屏幕输出

`a` : 追加，在当前行后添加一行或多行。添加多行时，除最后一行外，每行末尾需要用”\”代表数据未完结。
`c` : 行替换，用c后面的字符串替换原数据行，替换多行时，除最后一行外，每行末尾需要用”\”代表数据未完结。
`i` : 插入，在当前行前插入一行或多行。插入多行时，除最后一行外，每行末尾需要用”\”代表数据未完结。
d : 删除，删除指定的行。
p : 打印，输出指定的行。
s : 字串替换，用一个字符串替换另外一个字符串。格式为“行范围s/旧字串/新字串/g”（和vim中的替换格式类似）

 sed -n '2p' user.txt    　　　　# 输出第二行, p一般都要和-n使用，不-n会显示出所有的行
df -h | sed -n '2p'    　　  　　# 管道符结果作为操作内容
sed '2,4d' user.txt    　　　　# 删除文件的第2行到第4行，显示剩下的行，没有加 i 选项，不会更改文件内容
sed '2a hello' user.txt    　　# 在第二行后追加hello，仅仅修改命令输出
sed '2i hello \
　　world' user.txt    　　　　# 在第二行前插入两行数据，仅仅修改命令输出
sed '2c No person' user.txt    # 把第二行替换为No person
sed '2s/M/F/g' user.txt    　　# 把第二行的M替换为F后输出
sed -i '2s/M/F/g' user.txt　　# 把替换后的结果写入文件
sed -e 's/zhang//g ; s/wang//g' user.txt    # -e 允许多条命令顺序执行，用分号隔开，s前面不加数字表示所有行

转载自链接：http://www.jianshu.com/p/1bbdbf1aa1bd

正文完

请博主喝杯咖啡吧！

Linux

发表至： Linux

2017-09-03

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

rsync+inotify实现文件实时同步（二）

linux shell中使用awk sed等命令

最新 centos8 更新源教程

32位和64位的Linux系统区别

Deep Learning：神经网络的优化技巧（Review）

linux shell中使用awk sed等命令

cut

选项

使用

printf

输出类型：

输出格式：

awk

命令

条件（pattern）：一般使用关系表达式作为条件

动作（Action）

例子

说明

sed

命令

选项：

动作：（要加双引号）

例子

	$> cat user.txt
	01, zhang, M, 18
	02, wang, M, 20
	03, li, M, 21

	# 以","分隔，显示第二列
	$> cut -d "," -f 2 user.txt
	zhang
	wang
	li

	# 以","分隔，显示第1列和第3列
	$> cut -d "," -f 1,3 user.txt
	01, M,
	02, M,
	03, M,

	# 以","分隔，显示第1-3列
	$> cut -d "," -f 1-3 user.txt
	01, zhang, M,
	02, wang, M,
	03, li, M,

	# 以","分隔，显示除第1列以外的其他列
	$> cut -d "," -f 1 --complement user.txt
	zhang, M, 18
	wang, M, 20
	li, M, 21
	## 注意前面是有空格的！

	###### 字符串
	$> cut -c1-5 user.txt
	01, zh
	02, wa
	03, li

	printf %s 1 2 3 4 5 6 # 把123456当成一个字符串输出，没有格式
	printf %s %s %s 1 2 3 4 5 6 # 把%s%s123456当做字符串输出，没有格式
	printf '%s ' 1 2 3 4 5 6 # 把1 2 3 4 5 6当做字符串输出，输出格式为空格
	printf '%s\n' 1 2 3 4 5 6 # 输出格式为1个一行
	printf '%s %s %s' 1 2 3 4 5 6 # 把内容当做字符串三个为一组输出，1 2 34 5 6
	printf '%s %s %s\n' 1 2 3 4 5 6 # 输出格式为3个一行
	printf '%s' (cat user.txt) # 输出文本内容为字符串
	printf '%s\t %s\t %s\t %s\n'(cat user.txt)　　# 把文本内容格式化输出

	# 大括号前面没有条件，直接执行命令，这里的printf 是awk的命令，2 提取文件第二列，3 提取文件第三列，0 提取所有列
	awk '{printf2 "\t" 3"\n"}' user.txt

	# 打印三列，这里的print是awk的命令，系统并没有print命令，所以只能在awk里使用；与printf的区别是：print会自动在行尾加换行符，而printf不会
	df -h \| awk '{print1 "\t" 5 "\t"6 "\t"}'

	# 提取系统已使用硬盘空间，可以把结果赋给一个变量，判断是否大于某个值，进行报警
	df -h \| grep sda3 \| awk '{print 5}' \| cut -d '%' -f 1

	# 查看剩余内存不包含单位M
	free -h \| grep Mem \| awk '{print4}' \| cut -d 'M' -f 1

	# user.txt中不包含ID这行，提取满足条件为第四列值大于18的第二列
	cat user.txt \| grep -v ID \| awk '4>18 {printf2 "\n"}'

	sed -n '2p' user.txt 　　　　# 输出第二行, p一般都要和-n使用，不-n会显示出所有的行
	df -h \| sed -n '2p' 　　　　# 管道符结果作为操作内容
	sed '2,4d' user.txt 　　　　# 删除文件的第2行到第4行，显示剩下的行，没有加 i 选项，不会更改文件内容
	sed '2a hello' user.txt 　　# 在第二行后追加hello，仅仅修改命令输出
	sed '2i hello \
	world' user.txt 　　　　# 在第二行前插入两行数据，仅仅修改命令输出
	sed '2c No person' user.txt # 把第二行替换为No person
	sed '2s/M/F/g' user.txt 　　# 把第二行的M替换为F后输出
	sed -i '2s/M/F/g' user.txt　　# 把替换后的结果写入文件
	sed -e 's/zhang//g ; s/wang//g' user.txt # -e 允许多条命令顺序执行，用分号隔开，s前面不加数字表示所有行