➜ ~/code/awk grep -n -E '^$' bre 2: 5: 6: ➜ ~/code/awk grep -n -E '^$' bre -c 3 ➜ ~/code/awk cat -n bre 1 abc is a simple word. 2 3 What is the answer? 4 I am 23 years old. 5 6 7 I come from JiangSu...
➜ ~/code/awk cat -n bre 1 abc is a simple word. 2 3 What is the answer? 4 I am 23 years old. 5 6 7 I come from JiangSu... 8 #这是一个注释行 ➜ ~/code/awk grep '^$' bre -v abc is a simple word. What is the answer? I am 23 years old. I come from JiangSu... 8:#这是一个注释行 ➜ ~/code/awk grep '^$' bre -v | grep -E '#' -v abc is a simple word. What is the answer? I am 23 years old. I come from JiangSu...
用管道符将两个命令连接起来。
例子3:匹配以 . 结尾的行
1 2 3 4
➜ ~/code/awk grep '\.$' bre abc is a simple word. I am 23 years old. I come from JiangSu...
. 前要用转义符 \ 进行转义
【注】:在 Linux 下,所有文件每一行的结尾最后都有一个 $,可以加上参数 -E 查看,如下所示:
1 2 3 4 5 6 7 8 9
➜ ~/code/awk cat -En bre 1 abc is a simple word.$ 2 $ 3 What is the answer?$ 4 I am 23 years old.$ 5 $ 6 $ 7 I come from JiangSu...$ 8 #这是一个注释行$
例子4:在 bre 文件中找到以 a 或 w 开头的行,忽略大小写
1 2 3
➜ ~/code/awk grep -E -n -i '^[a|w]' bre 1:abc is a simple word. 3:What is the answer?
grep 整体比较简单,主要是正则表达式的使用。
四、sed
sed 是 Stream Editor(字符流编辑器)的缩写,简称流编辑器。
sed 是操作、过滤和转换文本内容的强大工具,常用功能包括结合正则表达式对文件实现快速增删改查,较为重要的两个功能是提取富川和提取整行。
➜ ~/code/awk cat -n bre 1 abc is a simple word. 2 3 What is the answer? 4 I am 23 years old. 5 6 My tel is 12345678999 7 My favirate food is hamburger. 8 I come from JiangSu... 9 10 11 #这是一个注释行 12 xxxx 13 xxxxxxx
1. 输出文件第3、4行
1 2 3
➜ ~/code/awk sed "3,4p" -n bre What is the answer? I am 23 years old.
sed 默认输出是所有的,因此要加上 -n 参数,p 表示打印。
2. 过滤含有 My 的字符串行
1 2 3
➜ ~/code/awk sed "/My/p" -n bre My tel is 12345678999 My favirate food is hamburger.
这里要匹配字符串 My,因此要用 /My/ 进行模式匹配,同样要用 -n 参数。
3. 删除有 is 的行
1 2 3 4 5 6 7 8 9 10
➜ ~/code/awk sed "/is/d" bre
I am 23 years old.
I come from JiangSu...
#这是一个注释行 xxxx xxxxxxx
我们这里用参数 d,表示删除匹配到的行,然后不用加 -n 参数,但是 bre 文件中的内容并不会被改变,因为 sed 是将文件内容读到内存中进行操作的。如果要对源文件进行修改,则要加上 -i 参数。
4. 删除第 5 行之后的行
1 2 3 4 5
➜ ~/code/awk sed '5,$d' bre abc is a simple word.
What is the answer? I am 23 years old.
这里模式是 5,$d,$ 表示文件末尾。
5. 将文件中的 is 全部替换成 IS,并打印前 5 行
1 2 3 4 5
➜ ~/code/awk sed 's/is/IS/g' bre | sed '1,5p' -n abc IS a simple word.
What IS the answer? I am 23 years old.
替换模式为 s/is/IS/g,这里 / 也可以换成 # 或 @。两个命令用管道连接,后面的 sed 无需指定文件名。
6. 将文件中的 is 全替换成 IS,同时将 23 替换成 35
1 2 3 4 5 6 7 8 9 10 11 12 13 14
➜ ~/code/awk sed -e 's/is/IS/g' -e 's#23#35#g' bre abc IS a simple word.
What IS the answer? I am 35 years old.
My tel IS 13545678999 My favirate food IS hamburger. I come from JiangSu...
#这是一个注释行 xxxx xxxxxxx
5 中的例子中有两个操作,是用管道符进行操作的,但是 sed 参数中提供了 -e 进行多次编辑,因此就不需要使用管道了。5 也可以这样写:
1 2 3 4 5
➜ ~/code/awk sed -e 's/is/IS/g' -e '1,5p' -n bre abc IS a simple word.
What IS the answer? I am 23 years old.
7. 在文件第 4 行后追加一行 Linux is funny..
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
➜ ~/code/awk sed '4a ##Today is Wednesday##' bre abc is a simple word.
What is the answer? I am 23 years old. Linux is funny..
My tel is 12345678999 My favirate food is hamburger. I come from JiangSu...
#这是一个注释行 xxxx xxxxxxx
8. 在文件第 1 行后追加一行 ##Today is Wednesday##
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
➜ ~/code/awk sed '1i ##Today is Wednesday##' bre ##Today is Wednesday## abc is a simple word.
What is the answer? I am 23 years old.
My tel is 12345678999 My favirate food is hamburger. I come from JiangSu...
Cherry 25 19990101 James 35 19850422 Anna 22 20000322 ChrisTim 48 19731225 Qiang 23 19990103 Sue 6 20160505 Paul 37 19850428 Steve 0 00000000
现在要输出第二行内容,命令如下:
1 2
➜ ~/code/awk awk 'NR==2' awk1 James 35 19850422
注意这里是 ==。如果要输出第二到第五行,则命令如下:
1 2 3 4 5
➜ ~/code/awk awk 'NR==2,NR==5' awk1 James 35 19850422 Anna 22 20000322 ChrisTim 48 19731225 Qiang 23 19990103
给每一行内容添加行号:
1 2 3 4 5 6 7 8 9
➜ ~/code/awk awk '{print NR,$0}' awk1 1 Cherry 25 19990101 2 James 35 19850422 3 Anna 22 20000322 4 ChrisTim 48 19731225 5 Qiang 23 19990103 6 Sue 6 20160505 7 Paul 37 19850428 8 Steve 0 00000000
输出第一列和最后一列:
1 2 3 4 5 6 7 8 9
➜ ~/code/awk awk '{print $1,$(NF)}' awk1 Cherry 19990101 James 19850422 Anna 20000322 ChrisTim 19731225 Qiang 19990103 Sue 20160505 Paul 19850428 Steve 00000000