Linux基础

华云天池 2022-05-19 发布于北京

展开全文

讲师_@王晓春

本章内容

▼文本工具
▼正则表达式
练习
练习答案

▼文本工具

▷文件截取工具

●文件内容：less,more和cat,tac,rev
●文件截取：head和tail
●按列抽取：cut,paste
●关键字：grep

1. cat [OPTION] file `查看文本文件`

[OPTION]	含意
`-E`	显示行结束符$
`-n`	显示行号
`-A`	显示控制符
`-b`	非空行编号
`-s`	连续空行成一行

cat、tac、rev

#cat
[root@CentOS7 dir1]$cat f1
abc
abcde
[root@CentOS7 dir1]$cat -E f1
123456$
12345$
1234$
123$

#tac上下倒序
[root@CentOS7 dir1]$tac f1
abcde
abc

#rev左右倒序
[root@CentOS7 dir1]$rev f1
cba
edcba

2. more [OPTION] file `分页查看`

[OPTION]	含意
`-d`	显示翻页提示

b	`上一页`
空格	`下一页`
回车	`下一行`

3. less [OPTION] file `分页查看`

/STRING		`搜索文本`
n			`下一个(搜索)`
N			`下一个(搜索)`
q			`退出`

*man命令使用less命令

4. head [OPTION] file

[OPTION]	含意
-c NUM	`选取前num字节`
-n NUM	`选取前num行`

[root@CentOS7 dir1]$head -n 3 /etc/passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin

`生成随机密码`
[root@CentOS7 dir1]$cat /dev/urandom | tr -dc [:alnum:] |head -c 8
7zy21yxo
[root@CentOS7 dir1]$

5. tail [OPTION] *file

[OPTION]	含意
-c NUM	`选取前num字节`
-n NUM 或 -NUM	`选取前num行`
-f	`实时刷新文件`
-F	`实时刷新文件/跟踪文件名`

tailf = tail -f

[root@CentOS7 dir1]$tail -n 3 /etc/passwd
jibill:x:1000:1000:jibill:/home/jibill:/bin/bash
tom99:x:800:1000:service:/data/tom:/bin/nologin
wang:x:1001:1001::/home/wang:/bin/bash

6. cut [OPTION] file

[OPTION]	含意
-d STRING	`指定分隔符string,默认tab`
-f NUM	`第num列`
-c NUM	`按字符切割`
–output-delimiter=STRING	`输出分隔符string`

#: 第#个字段
#,#[,#]：离散的多个字段，例如1,3,6
#-#：连续的多个字段, 例如1-6
混合使用：1-3,7

[root@CentOS7 dir1]$cut -d : -f 1 /etc/passwd
root
bin
daemon
adm
lp

`按字符分隔`
[root@CentOS7 dir1]$cat f4
123456i654321
12345i54321
1234i4321
123i321
[root@CentOS7 dir1]$cut -c2-3 f4
23
23
23
23
...
[tomcat@centos7 dir]$ echo 12345678 | cut -c 1-7
1234567

7. paste [OPTION] file 合并两个文件同行号的列到一行

[OPTION]	含意
-d CHAR	`指定分隔符,默认tab`
-s	`显示成行`

[root@CentOS7 dir1]$paste -d: f1 f3
123456:654321
12345:54321
1234:4321
123:321

▷文本分析工具

文本统计:wc
整理文本:sort
比较文件:diff 和 patch

8. wc [OPTION] file

[OPTION]	含意
-l	`行数`
-w	`单词数`
-c	`字节数`
-m	`字符数`
-L	`最长行的长度`

[root@CentOS7 dir1]$wc /etc/passwd
  45   89     2352    /etc/passwd
  |    |        |         |
`行数` `字数` `字节数`    `文件名`

[root@CentOS7 dir1]$ls /run/media/root/CentOS\ 7\ x86_64/Packages/*.rpm |wc -l
10019

9.sort [OPTION] file`文本排序`

[OPTION]	含意
-r	`反向`
-R	`随机`
-n	`数字`
-f	`忽略大小写`
-u	`删除重复行`
-t CHAR	`以CHAR为分隔符`
-k NUM	`分隔后的第NUM列`

10. uniq [OPTION] file`删除重复行`

[OPTION]	含意
-c	`重复行出现次数`
-d	`仅显示重复的行`
-u	`仅显示不重复的行`

11.diff [OPTION] file1 file2

[root@CentOS7 dir1]$diff -u f1 f2
--- f1	2019-05-03 16:33:25.294186421 +0800
+++ f2	2019-05-03 15:48:55.998025353 +0800
@@ -1,2 +1,5 @@
-wang
-jibill
+1
+2
+3
+4
+5

12.patch [OPTION] file

`复原文件`
diff -u f1 f2 > file.patch
patch -b f1 file.patch

13. grep [OPTION] STRING file

[OPTION]	含意
-v	`显示不被匹配的行`
-i	`忽略大小写`
-n	`显示行号`
-c	`统计行数`
-o	`仅显示匹配到的STRING`
-q	`不输出`
-A NUM	`显示后NUM行`
-B NUM	`显示前NUM行`
-C NUM	`显示前后NUM行`
-e	`or`
-w	`匹配单词`
-E	`使用ERE,扩展正则表达式,egrep`
-F	`fgrep,不支持正则表达式`
-f FILE	`从模式文件处理`

总结

▼正则表达式

Regular Expressions:

基本正则表达式:BRE
扩展正则表达式:ERE
元字符:字符匹配、匹配次数、位置锚定、分组

▷模式匹配:

字符匹配		匹配次数		位置锚定
`.`	匹配单个字符	`*`	匹配前面字符>0次	`^`	行首
`[]`	中括号里任意字符	`.*`	匹配任意长度任意字符	`$`	行尾
`[^]`	排除中括号里任意字符	`\?`	匹配前面字符0/1次	`^$`	空行
`[:alnum:]`	字母和数字	`\+`	匹配前面字符>1次	`\<` 或 `\b`	词首
`[:digit:]`	数字	`\{n\}`	匹配前面字符n次	`\>` 或 `\b`	词尾
`[:alpha:]`	字母	`\{m,n\}`	匹配前面至少m次,最多n次	`\<WORD\>`	整个单词
`[:lower:]`	小写字母	`{,n\}`	匹配前面字符最多n次
`[:upper:]`	大写字母	`{n,\}`	匹配前面字符最少n次	分组
`[:blank:]`	空白字符(空格和tab)			`$WORD$`	字符串做为整体
`[:space:]`	水平和垂直空白字符			`\\|`	或者
`[:cntrl:]`	不可打印控制字符			`\1` `\2`	分组引用
`[:graph:]`	要打印的非空字符
`[:print:]`	要打印字符
`[:punct:]`	标点符号

▷扩展正则表达式

字符匹配		匹配次数		位置锚定
`.`	匹配单个字符	`*`	匹配前面字符>0次	`^`	行首
`[]`	中括号里任意字符	`.*`	匹配任意长度任意字符	`$`	行尾
`[^]`	排除中括号里任意字符	`?`	匹配前面字符0/1次	`^$`	空行
`[:alnum:]`	字母和数字	`+`	匹配前面字符>1次	`\<` 或 `\b`	词首
`[:digit:]`	数字	`{n}`	匹配前面字符n次	`\>` 或 `\b`	词尾
`[:alpha:]`	字母	`{m,n}`	匹配前面至少m次,最多n次	`\<WORD\>`	整个单词
`[:lower:]`	小写字母	`{,n}`	匹配前面字符最多n次
`[:upper:]`	大写字母	`{n,}`	匹配前面字符最少n次	分组
`[:blank:]`	空白字符(空格和tab)			`(WORD)`	字符串做为整体
`[:space:]`	水平和垂直空白字符			`\|`	或者
`[:cntrl:]`	不可打印控制字符			`\1` `\2`	分组引用
`[:graph:]`	要打印的非空字符
`[:print:]`	要打印字符
`[:punct:]`	标点符号

14. egrep [OPTION] PATTERN file

相当于grep -E [OPTION] PATTERN FILE

练习

1、找出ifconfig “网卡名” 命令结果中本机的IPv4地址（）
2、查出分区空间使用率的最大百分比值（）
3、查出用户UID最大值的用户名、UID及shell类型（）
4、查出/tmp的权限，以数字方式显示（）
5、统计当前连接本机的每个远程主机IP的连接数，并按从大到小排序（）
6、显示三个用户root、mage、wang的UID和默认shell（）
7、找出/etc/rc.d/init.d/functions文件中行首为某单词(包括下划线)后面跟一个小括号的行（）
8、使用egrep取出/etc/rc.d/init.d/functions中其基名（）
9、使用egrep取出上面路径的目录名（）
10、统计last命令中以root登录的每个主机IP地址登录次数（答案）
11、利用扩展正则表达式分别表示0-9、10-99、100-199、200-249、250-255（答案）
12、显示ifconfig命令结果中所有IPv4地址（答案）
13、将此字符串：welcome to magedu linux 中的每个字符去重并排序，重复次数多的排到前面（答案）
14、复制/etc/profile至/tmp/目录，用查找替换命令删除/tmp/profile文件中的行首的空白字符（答案）
15、复制/etc/rc.d/init.d/functions文件至/tmp目录，用查找替换命令为/tmp/functions的每行开头为空白字符的行的行首添加一个#号（答案）
16、在vim中设置tab缩进为4个字符（答案）
17、复制/etc/rc.d/init.d/functions文件至/tmp目录，替换/tmp/functions文件中的/etc/sysconfig/init为/var/log（答案）
18、删除/tmp/functions文件中所有以#开头，且#后面至少有一个空白字符的行的行首的#（答案）

练习答案

1、找出ifconfig “网卡名” 命令结果中本机的IPv4地址

ifconfig ens33 |egrep -o '(([1-9]?[0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])[.]){3}([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])[[:blank:]]'

2、查出分区空间使用率的最大百分比值

[root@centos7 dir]$df | egrep -o '[0-9]{1,3}%' | tr -d %| sort -rn|head -1
100

3、查出用户UID最大值的用户名、UID及shell类型

[root@centos7 dir]$cat /etc/passwd | sort -t: -k3 -n | tail -1|cut -d: -f1,3,7
nfsnobody:65534:/sbin/nologin

4、查出/tmp的权限，以数字方式显示

[root@centos7 dir]$stat -c %a /tmp
1777

5、统计当前连接本机的每个远程主机IP的连接数，并按从大到小排序

netstat -tun | grep ESTAB |tr -s ” ” : |cut -d: -f6 |sort -nr |uniq -c

6、显示三个用户root、mage、wang的UID和默认shell

[root@centos7 dir]$cat /etc/passwd|cut -d: -f1,3,7|egrep 'wang|mage|root'
root:0:/bin/bash
wang:1002:/bin/bash
mage:1010:/bin/bash

7、找出/etc/rc.d/init.d/functions文件中行首为某单词(包括下划线)后面跟一个小括号的行

[root@centos7 dir]$cat /etc/rc.d/init.d/functions | egrep '^[[:alpha:]]*_?\('
checkpid() {
daemon() {
killproc() {
pidfileofproc() {
...

8、使用egrep取出/etc/rc.d/init.d/functions中其基名

[root@centos7 dir]$echo /etc/rc.d/ini.d/functions | egrep -o '/[^/]*'|tail -1|tr -d /
functions

9、使用egrep取出上面路径的目录名

[root@centos7 dir]$echo /etc/rc.d/ini.d/functions | egrep -o '^/.*/'
/etc/rc.d/ini.d/

10、统计last命令中以root登录的每个主机IP地址登录次数

[root@centos7 dir]$last | egrep -o '(([1-9]?[0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])[.]){3}([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])' | sort -n|uniq -c
     31 192.168.88.2

11、利用扩展正则表达式分别表示0-9、10-99、100-199、200-249、250-255

[0-9]、[1-9][0-9]、1[0-9][0-9]、2[0-4][0-9]、25[0-5]

12、显示ifconfig命令结果中所有IPv4地址

[root@centos7 dir]$ifconfig | egrep -o '(([1-9]?[0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])[.]){3}([1-9]?[0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])'
192.168.88.77
255.255.255.0
192.168.88.255
172.16.23.23
255.255.0.0
172.16.255.255
127.0.0.1
255.0.0.0
192.168.122.1
255.255.255.0
192.168.122.255

13、将此字符串：welcome to magedu linux 中的每个字符去重并排序，重复次数多的排到前面

[root@centos7 dir]$echo 'welcome to magedu linux'|grep -o [[:alpha:]]|sort|uniq -c|sort -t ' ' -k 1 -r
      3 e
      2 u
      2 o
      2 m
      2 l
      1 x
      1 w
      1 t
      1 n
      1 i
      1 g
      1 d
      1 c
      1 a

14、复制/etc/profile至/tmp/目录，用查找替换命令删除/tmp/profile文件中的行首的空白字符

:%s@^[[:space:]]*@@gc

15、复制/etc/rc.d/init.d/functions文件至/tmp目录，用查找替换命令为/tmp/functions的每行开头为空白字符的行的行首添加一个#号

:%s@^[[:blank:]]@#@g

16、在vim中设置tab缩进为4个字符

set ts=4

17、复制/etc/rc.d/init.d/functions文件至/tmp目录，替换/tmp/functions文件中的/etc/sysconfig/init为/var/log

:%s#\/etc\/sysocnfig\/init#\/var\/log#gc

18、删除/tmp/functions文件中所有以#开头，且#后面至少有一个空白字符的行的行首的#

:%s@[[:space:]]*#[[:blank:]]\+@@g

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：华云天池 > 《linux》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

华云天池

关注对话

TA的最新馆藏

[转] wps AI 一键生成课件
游戏, 建模, 编程 | 阿发你好 | 邵发
HTTPS 加密算法过程
懂虚拟机克隆你会吗？快速将系统和环境完全复制出一份
为你私密内容上把锁！Win10隐藏加密就能搞定，很多人却不知道
42张图详解 NAT : 换个马甲就能上网

喜欢该文的人也喜欢更多

热门阅读换一换