awk工具的使用
1.对文件中某一列内容相同的行只保留一行:
awk -F'|' '! a[$i]++' filename
对于awk -F'|' '! a[$i]++',需要了解4个知识点
(1)、-F'|' 将每一行以字符"|"为分隔符划分成列 (2)、awk数组知识,不说了
(3)、awk的基本命令格式 awk 'pattern{action}' 省略action时,默认action是{print},如awk '1'就是awk '1{print}' (4)、var++的形式:先读取var变量值,再对var值+1 以数据 1 2 3 1 2 3 1 2 4 1 2 5 为例,对于awk '!a[$3]++' awk的默认列分隔符是空格,因此这里就不需要用-F参数指定了 awk处理第一行时: 先读取a[$3]值再自增,a[$3]即a[3]值为空(0),即为awk '!0',即为awk '1',即为awk '1{print}'
awk处理第二行时: 先读取a[$3]值再自增,a[$3]即a[3]值为1,即为awk '!1',即为awk '0',即为awk '0{print}' ............. 最后实现的效果就是对于$3是第一次出现的行进行打印,也就是去除$3重复的行 |
|
来自: 用勿龍潛 > 《bash脚本语言》