`
canofy
  • 浏览: 821029 次
  • 性别: Icon_minigender_1
  • 来自: 北京、四川
社区版块
存档分类
最新评论

找访问日志中404的url地址

阅读更多
查找服务器上访问日志中出现了404的记录,并把地址替换成web可访问的方式,最后并发送邮件

重点:
这里主要应用了sed的正则表达式来进行查找替换,也用到了分组
发送邮件使用了email命令(mail命令貌似被禁了,发不出邮件,email命令应该需要装个什么东东吧,反正是在线下的服务器上没看到这个命令)进行发送,这个网上介绍的似乎很少,
用公司的邮箱发送不出去,到最后问了系统的管理员才知道是服务器把公司的smtp服务器直接给屏蔽掉了,最后只要用的是另外的邮箱发送,需要用户名和密码,没有直接使用mail命令简单。

日志格式:
211.139.190.202 - - [24/May/2009:10:11:33 +0800] GET /fggamedown/soh/soh?df=x&t=1&fr=qq&posid=5012 HTTP/1.1 404 763 - - - 10.45.46.238
211.137.69.234 - - [24/May/2009:10:11:41 +0800] POST /fggamedown/zyw/zyw001/ HTTP/1.1 404 763 - - - -
211.139.190.202 - - [24/May/2009:10:13:41 +0800] GET /fggamedown/zyw/zyw003/zyw003.jpg HTTP/1.1 404 763 http://wap.soso.com/game/index.jsp?sid=vshvjZDa/ayXmdFJoYat3g==&key=%E5%B0%84%E5%87%BB&paramBrand=sonyeric&pno=10 - - 10.45.2.41
211.139.190.202 - - [24/May/2009:10:13:53 +0800] GET /fggamedown/soh/soh?df=x&t=1&fr=qq&posid=5012 HTTP/1.1 404 763 - - - 10.45.46.238
211.138.172.201 - - [24/May/2009:10:14:10 +0800] POST /fggamedown/szm/szm002/ HTTP/1.1 404 763 - SAMSUNG-SGH-X628/1.0/WAP2.0 Profile/MIDP-2.0 Configuration/CLDC-1.1/*MzU3NzExMDAwMjkzMTI3 UP.Browser/6.2.3.3.c.1.101 (GUI) MMP/2.0 - -
211.137.59.23 - - [24/May/2009:10:14:26 +0800] GET /fggamedown/soh/soh004/more.jsp?sid=yqyyl1iUpZiXmdFJoYat3g==&key=%E8%B5%9B%E8%BD%A6&pB=&rB=%E8%AF%BA%E5%9F%BA%E4%BA%9A&format=jar&pid=1&title=%E6%9E%81%E5%93%81%E9%A3%9E%E8%BD%A6%E7%94%9F%E6%AD%BB%E5%8D%A1%E6%9C%AC%E8%B0%B7%28EA%E6%AD%A3%E7%89%88%29 HTTP/1.1 404 778 - - - 10.200.183.128
211.137.59.23 - - [24/May/2009:10:17:53 +0800] POST /fggamedown/soh/soh004/index.jsp?sid=yqyyl1iUpZiXmdFJoYat3g==&key=%E8%B5%9B%E8%BD%A6&paramBrand=&total=29 HTTP/1.1 404 778 - - - 10.200.183.128
211.137.69.234 - - [24/May/2009:10:23:32 +0800] POST /fggamedown/brw/brw001/ HTTP/1.1 404 763 - - - -
211.94.164.200 - - [24/May/2009:10:43:25 +0800] GET http://59.151.101.81:80/fggamedown/086/086003/download.do?op=download&bid=001&gid=086003&cid=007&id=16473&site=&posid=120&fmt=jad HTTP/1.1 404 778 - LENOVO-i921/240A - 10.92.250.3


shell脚本
lastday=`date --date="1 day ago" +%Y-%m-%d`;
accesslog_path=/var/log/accesslog;
log_name=${accesslog_path}"/"localhost_access_log.$lastday.txt;

grep -e "1.. 404" ${log_name}|sed -n 's/^.*T.\(\/.*ja[rd]\).*HTTP.*$/http:\/\/192.168.1.1\1/p'>/usr/local/tomcat-5.0.28/webapps/webdav/error404_monitor.txt;


email -f "***@126.com" -s "test" -n "name" -r "smtp.126.com" -u "***" -i "***" -m login "***@gmail.com"</usr/local/tomcat-5.0.28/webapps/webdav/error404_monitor.txt



最后的结果类似如下:
http://192.68.1.1/fggamedown/076/076001/sghx_SEK700.jad
http://192.68.1.1/fggamedown/076/076001/sghx_n7370.jar
http://192.68.1.1/fggamedown/076/076001/sghx_E398.jar
分享到:
评论

相关推荐

    Nginx日志管理介绍

    通过访问日志,你可以得到用户地域来源、跳转来源、使用终端、某个URL访问量等相关信息;通过错误日志,你可以得到系统某个服务或server的性能瓶颈等。因此,将日志好好利用,你可以得到很多有价值的信息。 参数明细...

    Nginx自定义访问日志的配置方式

    通过访问日志,你可以得到用户地域来源、跳转来源、使用终端、某个URL访问量等相关信息。 日志的重要性不言而喻,一般来说我们开发过程中会为每个项目定义自己的日志格式以及存储路径。 就我们普通的JAVAWEB项目来说...

    使用Awstats分析Nginx的访问日志.doc

    另外可能有很多的站长不愿意使用这类工具来暴露自己的数据,种种的这些因素使站长希望自己来分析访问日志。而awstats就可以满足所有的这些需求。 Awstats 是在 SourceForge 上发展很快的一个基于 Perl 的 WEB 日志...

    Linux系统监控shell程序包-含内存cpu硬盘监控进程监控进程守护删除过期日志url监控webservice监控

    getUrlResult.sh:获取指定url的访问结果 killProcess.sh:杀死指定进程 bak.sh:备份脚本,用于把指定目录下的文件自动远程复制到指定服务器 详细使用请查看博文:...

    论文研究-基于用户访问兴趣的Web日志挖掘.pdf

    首先以Web日志为基础构建相关矩阵, 使用平均访问时间相似度和访问路径相似度共同度量用户访问兴趣的相似程度, 最后采用直接聚类去除相交项的聚类算法将相似用户和相关URL聚类. 实证分析结果表明该算法能较好地解释...

    Web服务器日志分析.pptx

    日志内容 错误日志包含 获知失效链接 获知 CGI 错误 获知用户认证错误 访问日志包含 : 访问服务器的远程机器的地址:可以得知浏览者来自何方 浏览者访问的资源:可以得知网站中的哪些部分最受欢迎 浏览者的浏览...

    Nginx访问日志及错误日志参数说明

    其中访问日志记录客户端访问nginx的每一个请求,包含用户地域来源、跳转来源、使用终端、某个URL访问量等信息,访问日志格式可以自定义;错误日志则记录客户端访问nginx出错时的日志,格式不支持自定义,通过错误...

    探测URL监控系统运行情况

    #参数:URL地址,应用中文名称,唯一识别码(访问url后返回的特定字符串) #依赖脚本:数据库操作脚本dbExecurteSQL.sh #数据库操作脚本资源:https://download.csdn.net/upload/10975286 #作者:baocr #时间:2019-...

    Nginx日志实现访问异常报警详解

    在工作中为了防止一些恶意访问的行为,例如不断的请求刷流量,通过实时过滤Nginx访问日志,将单位时间内访问次数达到指定阀值的来源ip及时的通知系统管理员,这里通过邮件的方式通知。 监控脚本 vim /opt/nginx/...

    日志文件解析后用jdbc入库的代码,见博客描述

    logs中就是为我们日常记录的日志文件,你要对起进行分析记录入表。 这些日志文件名都是有一定规则每小时生成一个。拿附件中的文件来说access_log.2009-04-30.17.log 表示2009年4月30日17时的数据。 记录到数据里对应...

    python统计日志ip访问数的方法

    主要介绍了python统计日志ip访问数的方法,涉及Python操作日志文件及正则匹配的相关技巧,非常具有实用价值,需要的朋友可以参考下

    centos中nginx按日期自动分割访问日志的方法

    Web 访问日志 (access_log) 记录了所有外部客户端对Web服务器的访问行为,包含了客户端IP,访问日期,访问的URL资源,服务器返回的HTTP状态码等重要信息。 一条典型的Web访问日志如下: 代码如下: 192.168.50.195...

    基于大规模日志分析的搜索引擎用户行为分析

    基于搜狗真实日志数据分析的搜索引擎用户行为分析

    IIS6.0 IIS,互联网信息服务

    它除了能够用IIS服务器所在的计算机名来代替之外,还可在DNS服务器中新建域名和相应IP地址的映射表,就也可以用域名来进行访问了! Q:我设置好了一个Web服务器,但是当我访问网页时,却出现密码提示窗口。这是为...

    python写的一个squid访问日志分析的小程序

    昨天在群里,贴了一个需求,就是统计squid访问日志中ip 访问数和url的访问数并排序,不少同学都大体实现了相应的功能,我把我简单实现的贴出来,欢迎拍砖: 日志格式如下: 复制代码 代码如下: %ts.tu %6tr %{X-...

    探测指定url返回成功或失败函数

    #探测指定url返回函数 #返回1 则表示正常,否则异常 探测指定url,并根据特定字符串来确定是否有效,如果探测url不可访问则形成日志并记录入库

    banshee:Banshee 是一个 Python 脚本,它跟踪您的访问日志并禁止滥用 IP 地址访问您的 Django 应用程序

    女妖Banshee 是一个 Python 脚本,它跟踪您的访问日志并禁止滥用 IP 地址访问您的 Django 应用程序。安装将 'ip' 目录放入 Django 项目目录中。 通过在您的 INSTALLED_APPS 中添加“ip”来更新您的项目 settings.py...

    Flask-Logging:过滤来自 Flask 日志的请求

    当请求充满 /static/ URL 时,在开发过程中很有用。 不用于生产,Flask-Logging 猴子修补了werkzeug日志功能。安装 pip install flask-logging用法 from flask_logging import Filterfilter = Filter('static')从...

    tomcat日志分析(awstats)

    此文档包含了linux和windows的配置及所需文件。 Awstats是一个免费非常简洁而且强大有个性的统计工具。... 八:Pages-URL的统计  九:访客操作系统浏览器等信息  十:其它信息(搜索关键字等等)

    AWStats- 非常好用Apache,vsftp日志分析工具

    本日志分析器作为CGI或从命令行在数个图形网页中显示你日志中包含的所有可能信息. 它利用一部分档案资料就能经常很快地处理大量日志档案, 它能分析日志文件来自从各大服务器工具 ,如 Apache日志档案 s (NCSA ...

Global site tag (gtag.js) - Google Analytics