`

sort与uniq,wc使用

 
阅读更多

 

 

sort  排序  -u 去除重复的行   -r降序(默认升序)  重定向输入文件 

      -n 按照数字排序 

      -t选项按照什么字符来分割    -k选项:分割后取第几个字段排序 

      -f 忽略大小写 

      -b 忽略前面的空白符,从第一个可见的字符比较 

 

 

测试数据:

    

google 110 5000
baidu 100 5000
guge 50 3000
sohu 100 4500
xiaomi 10 20
huawei 20 33

 

 

数据按照空格分割后取第二列 按照数字升序排列 

sort -n -t ' ' -k 2 b.txt

 

 

uniq 对连续相同的数据去重和统计 (一般先排序在统计,这样相同的就到一起了 )

    uniq命令不加任何参数,仅显示连续重复的行一次

   -c 行首显示本行出现的重复次数

   -d 只显示重复的 

   -u  只显示不重复的行

 

 wc 统计文件中数据:

     -l 统计行数。 

  -L 打印最长行的长度。

 如:下面是对文件fs_sort.txt排序去重后统计重复数据的行数

  cat fs_sort.txt| sort | uniq -d | wc -l

 

查看两个文件相同的行和不同的行的数据:

  

 两个文件中相同的行:
  grep -Ff  222.txt 111.txt

两个文件中不同的行:
     grep -vFf  222.txt 111.txt

 

 

 

 

 

分享到:
评论

相关推荐

    Linux sort,uniq,cut,wc命令详解

    sort  sort 命令对 File 参数指定的文件中的行排序,并将结果写到标准输出。如果 File 参数指定多个文件,那么 sort 命令将这些文件连接起来...  -n :使用『纯数字』进行排序(默认是以文字型态来排序的);  -r 

    linear-counter:线性计数器C ++实现

    该算法不需要存储和排序所有给定的条目,并且具有O(1)的空间复杂度和O(N)的时间复杂度,这比使用| sort | uniq | wc -l更快| sort | uniq | wc -l | sort | uniq | wc -l | sort | uniq | wc -l 。安装在macOS...

    一个简单的Bash脚本,用于处理Nginx的访问日志,并提取一些基本信息

    这个脚本使用了一些基本的Unix命令,如grep、cut、sort、uniq和wc,来处理和分析日志文件。你可以根据自己的需求修改和扩展这个脚本。 请注意,这个脚本只是一个简单的示例,用于提取一些基本的统计信息。如果你需要...

    Nginx日志统计分析的常用命令总结

    本文主要给大家总结了关于Nginx日志统计分析...grep 07/Apr/2017:0[4-5] access.log | awk '{print $1}' | sort | uniq -c| sort -nr | wc -l 查看访问最频繁的前100个IP awk '{print $1}' access.log | sort -n |uniq

    est:大量数据的快速基数和TopK估计的Shell程序

    cat file | sort | uniq | wc -l cat file | sort | uniq | wc -l – 获取文件中唯一行数的最简单方法。 但是有一个问题。 即, sort 。 当文件中有数千万,有时甚至数百万行时,排序就变得太昂贵了。 如果您可以用...

    判断CC攻击 netstat命令详解

    查看所有80端口的连接数 代码如下: netstat -nat|grep -i “80″|wc -l 对连接的IP按连接数量进行排序 代码如下: netstat -ntu | awk ‘{print $5}’ | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 ...

    oralce hugepage

    cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l # 查看每个物理CPU中core的个数(即核数) cat /proc/cpuinfo| grep "cpu cores"| uniq # 查看逻辑CPU的个数 cat /proc/cpuinfo| grep "processor"| wc -...

    Linux下查看CPU型号,内存大小命令(详情)

    cat /proc/cpuinfo| grep “physical id”| sort| uniq| wc -l 查看每个物理CPU中core的个数(即核数) cat /proc/cpuinfo| grep “cpu cores”| uniq 查看逻辑CPU的个数 cat /proc/cpuinfo| grep “processor”| wc -...

    windows下的shell环境模拟

    windows下的shell环境模拟程序集合,从cygwin下提取出来,包含常用的命令集合:basename/dirname/mkdir/mv/rm/cp/sort/split/find/awk/sed/xargs/tar/grep/gzip/zip/unzip/head/tail/ls/cat/uniq/wc/more/scp/ssh/...

    windows 文本工具

    windows平台下使用linux/unix平台上的文本处理工具 grep wc head tail nl sed sort tr od uniq

    Linux中查看物理CPU个数、核数、逻辑CPU个数的方法

    cat /proc/cpuinfo| grep “physical id”| sort| uniq| wc -l # 查看每个物理CPU中core的个数(即核数) cat /proc/cpuinfo| grep “cpu cores”| uniq # 查看逻辑CPU的个数 cat /proc/cpuinfo| grep “processor”...

    详解Linux服务器状态、性能相关命令

    [root@host /]# cat /proc/cpuinfo | grep physical id | sort | uniq | wc -l #查看每个物理CPU的核数 [root@host /]# cat /proc/cpuinfo | grep cpu cores | uniq #逻辑CPU的个数(逻辑CPU = 物理CPU个数*核数...

    Linux运维常用命令

     awk '{print $1}' log_file|sort|uniq|wc -l PS: wc -l 看看有多少行 2、查看某一个页面被访问的次数: grep /index.php log_file | wc -l 3、查看每一个IP访问了多少个页面: awk '{++S[$1]} END {for (a in S)...

    史上最全的 Linux Shell 文本处理工具集锦.doc

    本文将介绍Linux下使用Shell处理文本时最常用的工具:find、grep、xargs、sort、uniq、tr、cut、paste、wc、sed、awk;提供的例子和参数都是最常用和最为实用的;对shell脚本使用的原则是命令单行书写,尽量不要超过...

    Linux课堂笔记.pdf

    一、操作系统概述 1、 操作系统 2、 不同应用利于的主流操作系统二、系统安装 1、安装VM虚拟机 ...2.8.6 sort命令 2.8.7 wc命令 2.8.8 uniq命令 2.8.9 tee命令 2.8.10 tr命令 2.8.11 split命令 2.8.12 awk命令

    Python实现的多进程拷贝文件并显示百分比功能示例

    本文实例讲述了Python实现的多进程...cat /proc/cpuinfo| grep physical id| sort| uniq| wc -l # 查看每个物理CPU中core的个数(即核数) cat /proc/cpuinfo| grep cpu cores| uniq # 查看逻辑CPU的个数 cat /proc/cpuin

    RabbitMQ-performance-test

    cat /proc/cpuinfo | grep "physical id" | sort | uniq | wc -l 8 cat /proc/cpuinfo | grep "cpu cores" | uniq | awk -F: '{print $2}' 1 ###结果: #####发布: 队列号 连接器编号 中央处理器 每秒...

    python基础教程:Python实现的多进程拷贝文件并显示百分比功能示例

    本文实例讲述了Python实现的...cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l # 查看每个物理CPU中core的个数(即核数) cat /proc/cpuinfo| grep "cpu cores"| uniq # 查看逻辑CPU的个数 cat /proc/cpuinf

    Linux查看某个端口的连接数的方法

    一、查看哪些IP连接本机 netstat -an 二、查看TCP连接数 1)统计80端口连接数 netstat -nat | grep -i 80 | wc -l ...netstat -anp | grep ESTABLISHED | awk {print $5}|awk -F: {print $1} | sort | uniq

    Linux命令大全

    电子邮件与新闻组 archive ctlinnd elm getlist inncheck mail mailconf mailq messages metamail mutt nntpget pine slrn X WINDOWS SYSTEM reconfig startx(start X Window) Xconfigurator XF86Setup xlsatoms ...

Global site tag (gtag.js) - Google Analytics