`
longzhun
  • 浏览: 362247 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Apache log 日志分析

 
阅读更多

日常分析日志必备

 

1、查看当天有多少个IP访问:
awk '{print $1}' log_file|sort|uniq|wc -l


2、查看某一个页面被访问的次数:
grep "/index.php" log_file | wc -l


3、查看每一个IP访问了多少个页面:
awk '{++S[$1]} END {for (a in S) print a,S[a]}' log_file


4、将每个IP访问的页面数进行从小到大排序:
awk '{++S[$1]} END {for (a in S) print S[a],a}' log_file | sort -n


5、查看某一个IP访问了哪些页面:
grep ^111.111.111.111 log_file| awk '{print $1,$7}'


6、去掉搜索引擎统计当天的页面:
awk '{print $12,$1}' log_file | grep ^\"Mozilla | awk '{print $2}' |sort | uniq | wc -l


7、查看2009年6月21日14时这一个小时内有多少IP访问:
awk '{print $4,$1}' log_file | grep 21/Jun/2009:14 | awk '{print $2}'| sort | uniq | wc -l

 

8.查看访问前十个ip地址
awk '{print $1}' |sort|uniq -c|sort -nr |head -10 access_log

 

9.访问次数最多的文件或页面
cat access_log|awk '{print $11}'|sort|uniq -c|sort -nr

 

10.通过子域名访问次数,依据referer来计算,稍有不准
        cat access.log | awk '{print $11}' | sed -e ' s/http:\/\///' -e ' s/\/.*//' | sort | uniq -c | sort -rn | head -20

11. 列出传输大小最大的几个文件
        cat www.access.log |awk '($7~/\.php/){print $10 " " $1 " " $4 " " $7}'|sort -nr|head -100

12.   列出输出大于200000byte(约200kb)的页面以及对应页面发生次数
        cat www.access.log |awk '($10 > 200000 && $7~/\.php/){print $7}'|sort -n|uniq -c|sort -nr|head -100

13. 如果日志最后一列记录的是页面文件传输时间,则有列出到客户端最耗时的页面
     cat www.access.log |awk '($7~/\.php/){print $NF " " $1 " " $4 " " $7}'|sort -nr|head -100


14.   列出最最耗时的页面(超过60秒的)的以及对应页面发生次数

      cat www.access.log |awk '($NF > 60 && $7~/\.php/){print $7}'|sort -n|uniq -c|sort -nr|head -100

15. 列出传输时间超过 30 秒的文件
        cat www.access.log |awk '($NF > 30){print $7}'|sort -n|uniq -c|sort -nr|head -20

16. 列出当前服务器每一进程运行的数量,倒序排
        ps -ef | awk -F ' ' '{print $8 " " $9}' |sort | uniq -c |sort -nr |head -20

 

 

 

分析 特定url 哪些ip 访问次数分别是多少
cat /log/access.log | grep downfile | awk ‘{printf(”%s\n”,$1)}’ | sort | uniq -c | sort -n
分析apache日志得到蜘蛛ip的简单方法
cat access_log | grep spider | awk -F ” ” ‘{print $1}’ | sort | uniq > ~/spider_ip.txt

1,查看apache进程:
ps aux | grep httpd | grep -v grep | wc -l

2,查看80端口的tcp连接:
netstat -tan | grep "ESTABLISHED" | grep ":80" | wc -l

3,通过日志查看当天ip连接数,过滤重复:

cat access_log | grep "20/Oct/2008" | awk '{print $2}' | sort | uniq -c | sort -nr

4,当天ip连接数最高的ip都在干些什么(原来是蜘蛛):
cat access_log | grep "20/Oct/2008:00" | grep "122.102.7.212" | awk '{print $8}' | sort | uniq -c | sort -nr | head -n 10

5,当天访问页面排前10的url:

cat access_log | grep "20/Oct/2008:00" | awk '{print $8}' | sort | uniq -c | sort -nr | head -n 10

6,用tcpdump嗅探80端口的访问看看谁最高
tcpdump -i eth0 -tnn dst port 80 -c 1000 | awk -F"." '{print $1"."$2"."$3"."$4}' | sort | uniq -c | sort -nr
接着从日志里查看该ip在干嘛:
cat access_log | grep 122.102.7.212| awk '{print $1"\t"$8}' | sort | uniq -c | sort -nr | less


7,查看某一时间段的ip连接数:
grep "2006:0[7-8]" www20060723.log | awk '{print $2}' | sort | uniq -c| sort -nr | wc -l

分享到:
评论

相关推荐

    access_log日志分析

    apache的默认日志文件分析,用于IP统计访问量,查看某一时间段的ip连接数

    Python程序设计:python apache日志分析.pptx

    python apache日志分析 INTERNATIONAL MEDICAL SUMMIT FORUM python apache日志分析 任务背景 操作系统和许多程序会产生各种错误信息、警告信息和其他的提示信息,这种信息会记录到日志里面。系统日志里面有很多东西...

    apache log4j 日志系统实现原理.doc

    apache log4j 日志系统实现原理.doc,Apache Log4j 学习笔记 Apache Logging Project Homepage: http://logging.apache.org

    apache日志分析

    windows端日志分析软件,支持FTP远程获取linux,NT,OS日志

    基于Apache Log4cxx的C++日志库设计源码

    本项目是基于Apache Log4cxx的C++日志库设计源码,共有839个文件,其中包括305个C++源文件、233个头文件、54个属性文件、33个文本文件、32个Markdown文件、30个XML文件、18个版本控制文件、14个二进制文件、10个...

    apache log4j使用大全

    apache log4j使用大全 log4j使用

    Apache 访问日志分析工具

    java 读取apache访问日志并将IP和时间入库,另一个线程分析数据记录,指定时间内超过规定的访问次数,将IP添加进防火墙。以防止ddos攻击。

    apache-log4net-source-2.0.10.zip

    log4net是优秀的Apache log4j™框架到Microsoft®.NET运行时的移植。我们利用.NET运行时中的新功能,使该框架在本质上与原始log4j相似。 log4net是帮助程序员将日志语句输出到各种输出目标的工具。如果应用程序出现...

    logging-log4j2, Apache日志记录Log4J2镜像.zip

    logging-log4j2, Apache日志记录Log4J2镜像 Apache Log4J 2Apache是对 Log4J的升级,它提供了比它的前辈 Log4J 1. x,的显著改进,并提供了许多改进,同时解决了soa架构中一些固有问题。 在Github上请求请求通过发送...

    apache-log4cxx-0.10.0.tar.gz

    Log4cxx是Apache开源日志项目中的C++版本,Apache的开源日志项目移植于Java社区著名的Log4j,后来经过代码移植,现已有.NET、C++和PHP版本的日志库了。在很多的应用程序中,日志的使用非常的普遍

    org.apache.log4j

    Log4j是Apache的一个开放源代码项目,通过使用Log4j,我们可以控制日志信息输送的目的地是控制台、文件、GUI组件、甚至是套接口服务器、NT的事件记录器、UNIX Syslog守护进程等;我们也可以控制每一条日志的输出格式...

    Apache Log的每日一个日志文件及选择性记录设置

    针对Apache的Log文件太大的问题,采用每日一个日志文件及选择性记录日志的方式来处理这种问题。

    apache-log4j-2.16.0-bin.rar

    开源日志框架Apache Log4j2远程代码执行漏洞升级包

    apache日志分析工具

    命令用法: visitors -A -m 30 access.log -o html > report.html<br>access.log为当前apache日志 report.html为结果报表

    go-apachelog:使用 apache 通用日志格式的 go 服务器记录器

    不推荐使用 go-apachelog。 请参阅 github.com/cespare/hutil/apachelog 去 apachelog 这是一个以 Apache 通用日志格式编写服务器日志的小型库。 有关使用说明,请参阅。 代码主要基于logging.go。

    apache-log4j-2.0-rc1-src

    apache-log4j-2.0-rc1-src,开发工程进行用log4j进行日志记录,log4j-2.0的源码

    Log4j日志包

    log4j.appender.CONSOLE=org.apache.log4j.ConsoleAppender log4j.appender.CONSOLE.Target=System.out log4j.appender.CONSOLE.layout=org.apache.log4j.PatternLayout log4j.appender.CONSOLE.layout....

    apache-log-parser:流式Apache日志解析器

    apache日志解析器 用于Apache组合访问日志的流解析器。 例子 解析日志并将每一行作为一个对象: var LogParser = require ( 'apache-log-parser' ) ; var lp = LogParser ( { format : false } ) ; fs . ...

    apache mod_log_rotate

    此apache mod_log_rotate 是win32下vc9版的apache 日志文件管理工具。 使用: 复制mod_log_rotate.so到 Apache2/modules 确保你的系统安装了 Visual C++ 2008 Redistributable (可从这里下载:) ...

    apache-log4j-2.17.0 核心jar包

    Log4j 是一个日志记录框架,Log4j 2 是对 Log4j 的升级,提供了重大改进,超越其前身 Log4j 1.x,并提供许多其它现代功能 ,例如对标记的支持、使用查找的属性替换、lambda 表达式与日志记录时无垃圾等。 Apache ...

Global site tag (gtag.js) - Google Analytics