`
suncf1985
  • 浏览: 27950 次
  • 性别: Icon_minigender_1
  • 来自: 哈尔滨
社区版块
存档分类
最新评论

.sh 方式调用awk及一些常规信息处理

阅读更多
awkshtest.sh 内容如下:
#!/bin/sh
awk -F, 'BEGIN{OFS=",";print "......解析文件开始........"} END{print "......解析文件结束......"}
ARGIND==1{a[$1]=$1} #将t_mobile.txt漫游用户存入数组 a中
ARGIND==2{b[$1]=$1} #将t_plan_user.txt漫游用户存入数组b中
ARGIND>2{
if(0 == (match(tolower($1),/.*(\.gif|\.png|\.jpeg|\.bmp|\.def|\.jpg|\.css|\.ico|\.cur|\.swf|\.js|\.txt|\.avi|\.xml|\.zip|\.cab|\.crl|\.mp3|\.tpt|\.fcg|\.lrc|\.action|\.rar|\.m4a|\.idx|\.exe|\.dll|\.ini|\.vbs|\.doc).*/))){
#print "......清洗图片完成......";
if(substr($1,1,7) in a){
#print "......清洗漫游用户完成......";
if($1 not in b){
#print "......清洗无线上网卡用户完成......";
if($5==200 || $5==201 || $5==204 || $5==205){
#print "......清洗公有协议完成......";
#将URL地址按 / 折分,并存入url数组中
split($25,url,"/");
if(length(url) >4){
if(url[1]=="http:" || url[1]=="HTTP:"){
#print "......解析URL 带 HTTP头.....";
print strftime("%Y%m%d%H%M%S")$1NR+100000000,url[3],substr($25,8,length($25)-8) >> "page.txt";
print strftime("%Y%m%d%H%M%S")$1NR+100000000,url[3],substr($25,length(url[3])+8,length($25)-length(url[3])+8) >> "value.txt";
print strftime("%Y%m%d%H%M%S")$1NR+100000000,url[3],url[4] >> "leve_1.txt";
print strftime("%Y%m%d%H%M%S")$1NR+100000000,url[3],url[5] >> "leve_2.txt";
print strftime("%Y%m%d%H%M%S")$1NR+100000000,url[3],url[3] >> "domain.txt";
}else{
#print "......解析URL 不带 HTTP头......";
print strftime("%Y%m%d%H%M%S")$1NR+100000000,url[1],$25 >> "page.txt";
print strftime("%Y%m%d%H%M%S")$1NR+100000000,url[1],substr($25,length(url[1]),length($25)-length(url[1])) >> "value.txt";
print strftime("%Y%m%d%H%M%S")$1NR+100000000,url[1],url[1] >> "domain.txt";
print strftime("%Y%m%d%H%M%S")$1NR+100000000,url[1],url[2] >> "leve_1.txt";
print strftime("%Y%m%d%H%M%S")$1NR+100000000,url[1],url[3] >> "leve_2.txt";
}
}
}
}
}
}
}'  t_mobile.txt t_plan_user.txt *.txt

三个以上文件处理,t_mobile.txt 需要过滤的数据1,t_plan_user.txt 需要过滤的数据2,*.txt具体要处理的数据

其中数据1和数据2的格式为:
数据1:
1389574671*
1389574671*
1389574671*
1389574671*
1389574671*
数据2:
1389574*
1389574*
1389574*
1389574*
其中*带表具体数字
ARGIND=1 当读取第一个文件时,将第一个文件中的 $1列,存入数据 a 中
ARGIND=2 当读取第二个文件时,将第二个文件中的 $1列,存入数据 b 中
ARGIND>2 当处理文件从第三个开始,开始比较第三个以后的文件中与 a,b数组中的数据信息
分享到:
评论

相关推荐

    AWK_样式扫描和处理语言

    1.3 AWK的调用方式......................................................................................................................6 1.4 AWK的语法:..................................................

    windows 下的awk 命令工具

    windows 下的awk 命令工具

    awk.exe

    在windows编译httpd2.2.4时需要的awk.exe,apache官方网站上下载连接失效,这是本人从cygwin中提取的,已附带必要dll。 使用时建议放在X:\Program Files\Microsoft Visual Studio\VC98\Bin中。 <br>ps: ...

    JSON.awk:用AWK编写的实用JSON解析器

    特征没有外部依赖性的单个文件可以在一次调用中解析多个输入文件(每个文件一个JSON文本) (awk)挂接到解析器并输出事件实用回调(可选) 捕获无效的JSON输入以进行进一步处理选择MIT或Apache 2许可证兼容JSON.sh...

    使用NS-2模拟实现无线AD-hoc网络

    命令格式:$ sh statistic.sh | sh throughput.sh cbr.awk CBR数据包的发送、接收和丢弃情况统计脚本 命令格式:$ awk –f cbr.awk wireless-3node.tr nrlensorsim/ 该子目录中是NRL对NS-2的WSN扩展模块 上述各命令...

    some-ns2-trace-awk.rar_.awk_fichier awk ns2_ns2 script_some ns2

    ns2中的trace分析脚本,用于网络仿真,吞吐量,延时,抖动率的分析

    awk语言编程使用规则

    2. 三种方式调用awk 1) awk [opion] 'awk_script' input_file1 [input_file2 ...] awk的常用选项option有: ① -F fs : 使用fs作为输入记录的字段分隔符,如果省略该选项,awk使用环境变量IFS的值。 。。。。。。。...

    awk入门到精通.pdf

    为使读者快速掌握awk解题的模式及特性, 本手册系由一些较具代表性的范例及其题解所构成; 各范例由浅入深, 彼此间相互连贯,范例中并对所使用的awk语法及指令辅以必要的说明. 有关 awk的指令, 函数,...等条列式的说明...

    awk.Effective.awk.Programming.Universal.Text.Processing.and.Pattern.Matching.4th

    awk.Effective.awk.Programming.Universal.Text.Processing.and.Pattern.Matching.4th

    Oracle ass.awk工具

    ass.awk工具用在数据库hang住时分析收集到的systemstate所用,可以清晰明了的查看systemstate中的信息; 命令简单: $ awk -f ass1033.awk [trace_name_file] 在系统hung的时候,systemstate基本等同于hanganalyze...

    Effective.Awk.Programming.3rd.Edition

    Effective.Awk.Programming.3rd 高效awk编程,高清文字版

    ns_file.zip_ tcl awk_it

    awk file. It can be used as calculation of pdf.

    获取码流每帧大小 idx.awk

    利用estream的tools的save statistics保存每帧的起点和长度,文件格式为.csv; 使用idx.awk工具,./idx.awk aa.csv > aa.idx进行转换;

    Awk学习笔记

    1. awk简介 2. awk命令格式和选项 2.1. awk的语法有两种形式 2.2. 命令选项 3. 模式和操作 3.1. 模式 3.2. 操作 4. awk的环境变量 5. awk运算符 6. 记录和域 6.1. 记录 6.2. 域 6.3. 域分隔符 7. gawk专用...

    awk.exe或者awk95.exe

    windows环境 下的awk.exe或者awk95.exe

    linux 下Shell编程各个知识点举例

    awk.sh for.sh ip-get.sh read.sh tmp.sh calc.sh func.sh login.sh select.sh var.sh case.sh guess_data.sh nfs_install.sh shell-base.sh while.sh data_cmp.sh homework-3.sh ping.sh shell-test.sh file_...

    awk.cheat.sheet.pdf_awk_

    awk cheatsheet for beginners

    linux 文本处理 awk 手册

    awk还具有一些内建功能, 使得awk擅于处理具数据行(Record), 字段(Field)型态的资料; 此外, awk内建有pipe的功能, 可将处理中的数据传送给外部的 Shell命令加以处理, 再将Shell命令处理后的数据传回awk程序, 这个...

    fr.20415.0.trace2stats_v5b.rar_delay awk script

    Awk script for calculating throughput ,delay for MANETs

Global site tag (gtag.js) - Google Analytics