我们在线上跑的服务,不知道为什么最近有几回运行的进程莫名其妙的就没有了,就特意写了这个监控脚本,让其自动扫描服务,把访问不正常的服务,自动启动或重启服务,并且导出当时的线程使用情况,方便定位问题。
步骤:
1.修改web服务名称和端口
monitorTcp.sh
2.修改扫描时间
monitorServer.sh
3.启动守候进程
/usr/bin/nohup /bin/sh /home/Gzh/shell/monitorServer.sh 2>&1 > /dev/null &
monitorServer.sh
#!/bin/sh
###########################################################
#desc:后台守候检查服务是否正常
#author:gaozhonghui
#mail:toptreegzh@163.com
#date:20121210
###########################################################
while true
do
/bin/sh /home/Gzh/shell/monitorTcp.sh > /dev/null 2>&1
sleep 10
done
monitorTcp.sh
#!/bin/sh
#####################################################
#desc:扫描后台服务器的应用服务器,若不能正常访问则重启
#author:gaozhonghui
#mail:toptreegzh@163.com
#date:20121127
#######################################################
year=`date -d "today" +"%Y"`
monthday=`date -d "today" +"%m"`
date=$(date -d "today" +"%Y%m%d")
#被监控服务器、端口列表
#str = web服务文件夹:端口号
server_all_list=(
'www.test2.com:9090'
'www.test.com:8090'
)
#应用服务器基路径
serverBasePath="/web/webserver/jboss/"
#日志路径
logBasePath="/web/webserver/logs/$year/$monthday/"
#获得监控服务PID
function_getPID(){
local PID=`ps -ef|grep $1|grep java |awk '{print $2}'`
echo $PID
}
#dump 线程详细信息方便定位问题
function_jstackinfo(){
PID=`function_getPID $1`
if [ x$PID != x"" ] ;then
if [ ! -d ${logBasePath} ];then
mkdir -p ${logBasePath}
fi
jstack -l ${PID} >> ${logBasePath}"jstack_$1_${date}.log"
fi
}
#关闭应用服务
function_shutdown(){
local shutdownSh=${serverBasePath}$1"/bin/shutdown.sh"
if [ -f $shutdownSh ];then
local PID=`function_getPID $1`
if [ x$PID != x"" ] ;then
sh $shutdownSh > /dev/null 2>&1
sleep 2
fi
local PID2=`function_getPID $1`
if [ x$PID2 != x"" ];then
kill -9 $PID2
fi
fi
}
#启动应用服务
function_startup(){
local startupSh=${serverBasePath}$1"/bin/startup.sh"
if [ -f $shutdownSh ];then
sh $startupSh > /dev/null 2>&1
fi
}
#重启应用服务
function_restart(){
function_shutdown $1
sleep 5
function_startup $1
}
#扫描监控服务
for server in ${server_all_list[@]}; do
server_ip=127.0.0.1
server_name=$( echo ${server} | awk -F ':' '{print $1}')
server_port=$( echo ${server} | awk -F ':' '{print $2}')
#status: 0,http down 1,http ok 2,http down but ping ok
if nc -vv -z -w 2 $server_ip $server_port > /dev/null 2>&1;then
status=1
else
if nc -vv -z -w 3 $server_ip $server_port > /dev/null 2>&1;then
status=1
else
if ping -c 1 $server_ip > /dev/null 2>&1;then
status=2
else
status=0
fi
fi
fi
if [ x$status != x"1" ];then
PID=`function_getPID ${server_name}`
if [ x$PID != x ];then
function_jstackinfo ${server_name}
function_restart ${server_name}
else
function_startup ${server_name}
fi
fi
done
分享到:
相关推荐
自动监控Web服务进程的shell脚本。我们在线上跑的服务,不知道为什么最近有几回运行的进程莫名其妙的就没有了,就特意写了这个监控脚本,让其自动扫描服务,把访问不正常的服务,自动启动或重启服务,并且导出当时的...
15、Shell批量监控服务发送邮件报警.mp4 14、Linux下自动化运维企业案例.mp4 13、Linux系统增量备份脚本.mp4 12、Shell编程四剑客及案例详解.mp4 11、Shell编程之SED及GREP综合讲解.mp4 10、Linux下深入编程之函数及...
目录网盘文件永久链接 1.Linux下Shell编程基础入门.mp4 2.Shell编程之变量及LAMP导航菜单...17.Shell批量监控服务发送邮件报警.mp4 18.Shell编程之实战WEB界面展示一.mp4 19.Shell编程之实战WEB界面展示二.mp4 .....
现在单位为了省钱,我用了shell脚本,简单的写了一个监控。通过curl一个固定页面的200状态码,如果是200,就说网站是正常的,如果不是200就自动重启网站,然后发邮件到QQ邮箱。自己在上QQ的同时,通过微信也可以收到...
高级部分包含:Linux 性 能优化、大数据量备份、Shell 企业实战基础、Shell 实战高级编程、自动化运维趋势、 Puppet 自动化运维实战、Ansible 自动化运维实战、Jenkins 企业级自动化实战、企业 级高并发网站集群、...
自动化脚本部署k8s :一种是在线部署,一种是离线部署一:在线部署( online-deploy-k8s ),...离线部署是由shell脚本自动部署完成,该部署完成了k8s单主控两节点的架构, kuboard容器移植的WEB管理工具。基础环境:
3.1. 11 Kickstart自动化安装平台 56 4. Linux编程篇 60 4.1 Linux Shell编程 60 4.1. 1 Shell编程简介 60 4.1. 2 Shell变量设置 61 4.1. 3 Shell流程控制语句 62 4.1. 4 Shell脚本案例 67 4.1. 5 Shell数组编程 71 ...
3.1.11 Kickstart自动化安装平台 编程篇 4. I Linux Shell编程 4.1.1 Shel I编程简介 4.1.2She11变量设置 4.1.3 Shell流程控制语句 4.1.4 Shell脚本案例 4.1.5Shel1数组编程 5. Linux深入篇 5.1构建 Nginx WEB服务器...
Linux进阶篇总共包含9个章节,第15章到第38章学习内容分别包括:Linux性能优化、大数据量备份、Shell企业实战基础、Shell实战高级编程、自动化运维趋势、Puppet自动化运维实战、Ansible自动化运维实战、Jenkins企业...
Linux进阶篇总共包含9个章节,第15章到第38章学习内容分别包括:Linux性能优化、大数据量备份、Shell企业实战基础、Shell实战高级编程、自动化运维趋势、Puppet自动化运维实战、Ansible自动化运维实战、Jenkins企业...
Linux进阶篇总共包含9个章节,第15章到第38章学习内容分别包括:Linux性能优化、大数据量备份、Shell企业实战基础、Shell实战高级编程、自动化运维趋势、Puppet自动化运维实战、Ansible自动化运维实战、Jenkins企业...
Linux进阶篇总共包含9个章节,第15章到第38章学习内容分别包括:Linux性能优化、大数据量备份、Shell企业实战基础、Shell实战高级编程、自动化运维趋势、Puppet自动化运维实战、Ansible自动化运维实战、Jenkins企业...
Linux进阶篇总共包含9个章节,第15章到第38章学习内容分别包括:Linux性能优化、大数据量备份、Shell企业实战基础、Shell实战高级编程、自动化运维趋势、Puppet自动化运维实战、Ansible自动化运维实战、Jenkins企业...
Linux进阶篇总共包含9个章节,第15章到第38章学习内容分别包括:Linux性能优化、大数据量备份、Shell企业实战基础、Shell实战高级编程、自动化运维趋势、Puppet自动化运维实战、Ansible自动化运维实战、Jenkins企业...
Linux进阶篇总共包含9个章节,第15章到第38章学习内容分别包括:Linux性能优化、大数据量备份、Shell企业实战基础、Shell实战高级编程、自动化运维趋势、Puppet自动化运维实战、Ansible自动化运维实战、Jenkins企业...
Linux进阶篇总共包含9个章节,第15章到第38章学习内容分别包括:Linux性能优化、大数据量备份、Shell企业实战基础、Shell实战高级编程、自动化运维趋势、Puppet自动化运维实战、Ansible自动化运维实战、Jenkins企业...
2-8 Ansible实战安装Zabbix_Shell版 2-9 Ansible实战安装Zabbix_Playbook版 3-1 Zabbix介绍 3-10 Zabbix API使用教程-Python Zabbix SDK教程 3-2 Zabbix安装配置 3-3 Zabbix Web页面介绍 3-4 Zabbix配置自动发现、...
Linux进阶篇总共包含9个章节,第15章到第38章学习内容分别包括:Linux性能优化、大数据量备份、Shell企业实战基础、Shell实战高级编程、自动化运维趋势、Puppet自动化运维实战、Ansible自动化运维实战、Jenkins企业...
Linux进阶篇总共包含9个章节,第15章到第38章学习内容分别包括:Linux性能优化、大数据量备份、Shell企业实战基础、Shell实战高级编程、自动化运维趋势、Puppet自动化运维实战、Ansible自动化运维实战、Jenkins企业...
Linux进阶篇总共包含9个章节,第15章到第38章学习内容分别包括:Linux性能优化、大数据量备份、Shell企业实战基础、Shell实战高级编程、自动化运维趋势、Puppet自动化运维实战、Ansible自动化运维实战、Jenkins企业...