`

MySQL中kill僵死进程的脚本

阅读更多
MySQL + PHP的模式在大并发压力下经常会导致MySQL中存在大量僵死进程,导致服务挂死。为了自动干掉这些进程,弄了个脚本,放在服务器后台通过crontab自动执行。发现这样做了以后,的确很好的缓解了这个问题。把这个脚本发出来和大家Share.



根据自己的实际需要,做了一些修改:



SHELL脚本:mysqld_kill_sleep.sh



#!/bin/sh

mysql_pwd=”root的密码"

mysqladmin_exec="/usr/local/bin/mysqladmin"

mysql_exec="/usr/local/bin/mysql"

mysql_timeout_dir="/tmp"

mysql_timeout_log="$mysql_timeout_dir/mysql_timeout.log"

mysql_kill_timeout_sh="$mysql_timeout_dir/mysql_kill_timeout.sh"

mysql_kill_timeout_log="$mysql_timeout_dir/mysql_kill_timeout.log"

$mysqladmin_exec -uroot -p"$mysql_pwd" processlist | awk '{ print $12 , $2 ,$4}' | grep -v Time | grep -v '|' | sort -rn > $mysql_timeout_log

awk '{if($1>30 && $3!="root") print "'""$mysql_exec""' -e " "/"" "kill",$2 "/"" " -uroot " "-p""/"""'""$mysql_pwd""'""/"" ";" }' $mysql_timeout_log > $mysql_kill_timeout_sh

echo "check start ...." >> $mysql_kill_timeout_log

echo `date` >> $mysql_kill_timeout_log

cat $mysql_kill_timeout_sh



把这个写到mysqld_kill_sleep.sh。然后chmod 0 mysqld_kill_sleep.sh,chmod u+rx mysqld_kill_sleep.sh,然后用root账户到cron里面运行即可,时间自己调整。

执行之后显示:







www# ./mysqld_kill_sleep.sh

/usr/local/bin/mysql -e "kill 27549" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27750" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27840" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27867" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27899" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27901" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27758" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27875" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27697" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27888" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27861" -uroot -p"mysql root的密码";



如果确认没有问题了,把最后的cat修改为sh即可。



本人改写了下上面的脚本:



#!/bin/bash

mysql_pwd="密码"

mysql_exec="/usr/local/mysql/bin/mysql"

mysql_timeout_dir="/tmp"

mysql_kill_timeout_sh="$mysql_timeout_dir/mysql_kill_timeout.sh"

mysql_kill_timeout_log="$mysql_timeout_dir/mysql_kill_timeout.log"

$mysql_exec -uroot -p$mysql_pwd -e "show processlist" | grep -i "Locked" >> $mysql_kill_timeout_log

chmod 777 $mysql_kill_timeout_log

for line in `$mysql_kill_timeout_log  | awk '{print $1}'`

do

echo "$mysql_exec -uroot -p$mysql_pwd -e /"kill $line/"" >> $mysql_kill_timeout_sh

done

chmod 777 $mysql_kill_timeout_sh

cat $mysql_kill_timeout_sh



============================================================================



很多时候!一不小心就锁表!这里讲解决锁表终极方法!



案例一



mysql>show processlist;



参看sql语句



一般少的话



mysql>kill thread_id;



就可以解决了



kill掉第一个锁表的进程, 依然没有改善. 既然不改善, 咱们就想办法将所有锁表的进程kill掉吧, 简单的脚本如下.



#!/bin/bash

mysql - u root - e " show processlist " | grep - i " Locked " >> locked_log . txt



for line in ` cat locked_log.txt | awk '{print $1 }' `

do

echo " kill $line ; " >> kill_thread_id . sql

done

现在kill_thread_id.sql的内容像这个样子



kill 66402982 ;

kill 66402983 ;

kill 66402986 ;

kill 66402991 ;

.....

好了, 我们在mysql的shell中执行, 就可以把所有锁表的进程杀死了.



mysql > source kill_thread_id . sql



当然了, 也可以一行搞定

for id in `mysqladmin processlist | grep -i locked | awk '{print $1}'`

do

mysqladmin kill ${id}

done



案例二



如果大批量的操作能够通过一系列的select语句产生,那么理论上就能对这些结果批量处理。

但是mysql并没用提供eval这样的对结果集进行分析操作的功能。所以只能现将select结果保存到临时文件中,然后再执行临时文件中的指令。

具体过程如下:

mysql> SELECT concat('KILL ',id,';') FROM information_schema.processlist WHERE user='root';

+------------------------+

| concat('KILL ',id,';')

+------------------------+

| KILL 3101;           

| KILL 2946;           

+------------------------+

2 rows IN SET (0.00 sec)

mysql> SELECT concat('KILL ',id,';') FROM information_schema.processlist WHERE user='root' INTO OUTFILE '/tmp/a.txt';

Query OK, 2 rows affected (0.00 sec)

mysql> source /tmp/a.txt;

Query OK, 0 rows affected (0.00 sec)





案例三



MySQL + PHP的模式在大并发压力下经常会导致MySQL中存在大量僵死进程,导致服务挂死。为了自动干掉这些进程,弄了个脚本,放在服务器后台通过crontab自动执行。发现这样做了以后,的确很好的缓解了这个问题。把这个脚本发出来和大家Share.

根据自己的实际需要,做了一些修改:

SHELL脚本:mysqld_kill_sleep.sh

#!/bin/sh

mysql_pwd="root的密码"

mysqladmin_exec="/usr/local/bin/mysqladmin"

mysql_exec="/usr/local/bin/mysql"

mysql_timeout_dir="/tmp"

mysql_timeout_log="$mysql_timeout_dir/mysql_timeout.log"

mysql_kill_timeout_sh="$mysql_timeout_dir/mysql_kill_timeout.sh"

mysql_kill_timeout_log="$mysql_timeout_dir/mysql_kill_timeout.log"

$mysqladmin_exec -uroot -p"$mysql_pwd" processlist | awk '{ print $12 , $2 ,$4}' | grep -v Time | grep -v '|' | sort -rn > $mysql_timeout_log

awk '{if($1>30 && $3!="root") print "'""$mysql_exec""' -e " "\"" "kill",$2 "\"" " -uroot " "-p""\"""'""$mysql_pwd""'""\"" ";" }' $mysql_timeout_log > $mysql_kill_timeout_sh

echo "check start ...." >> $mysql_kill_timeout_log

echo `date` >> $mysql_kill_timeout_log

cat $mysql_kill_timeout_sh

把这个写到mysqld_kill_sleep.sh。然后chmod 0 mysqld_kill_sleep.sh,chmod u+rx mysqld_kill_sleep.sh,然后用root账户到cron里面运行即可,时间自己调整。

执行之后显示:



www# ./mysqld_kill_sleep.sh

/usr/local/bin/mysql -e "kill 27549" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27750" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27840" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27867" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27899" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27901" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27758" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27875" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27697" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27888" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27861" -uroot -p"mysql root的密码";

如果确认没有问题了,把最后的cat修改为sh即可。



本人改写了下上面的脚本:

#!/bin/bash

mysql_pwd="密码"

mysql_exec="/usr/local/mysql/bin/mysql"

mysql_timeout_dir="/tmp"

mysql_kill_timeout_sh="$mysql_timeout_dir/mysql_kill_timeout.sh"

mysql_kill_timeout_log="$mysql_timeout_dir/mysql_kill_timeout.log"

$mysql_exec -uroot -p$mysql_pwd -e "show processlist" | grep -i "Locked" >> $mysql_kill_timeout_log

chmod 777 $mysql_kill_timeout_log

for line in `$mysql_kill_timeout_log  | awk '{print $1}'`

do

echo "$mysql_exec -uroot -p$mysql_pwd -e \"kill $line\"" >> $mysql_kill_timeout_sh

done

chmod 777 $mysql_kill_timeout_sh

cat $mysql_kill_timeout_sh



是不是很方便呢!

=============================================================



processlist命令的输出结果显示了有哪些线程在运行,可以帮助识别出有问题的查询语句,两种方式使用这个命令。



1. 进入mysql/bin目录下输入mysqladmin processlist;



2. 启动mysql,输入show processlist;



如果有SUPER权限,则可以看到全部的线程,否则,只能看到自己发起的线程(这是指,当前对应的MySQL帐户运行的线程)。



得到数据形式如下(只截取了三条):



mysql> show processlist;



+-----+-------------+--------------------+-------+---------+-------+----------------------------------+----------



| Id | User | Host | db | Command | Time| State | Info



+-----+-------------+--------------------+-------+---------+-------+----------------------------------+----------



|207|root |192.168.0.20:51718 |mytest | Sleep | 5 | | NULL



|208|root |192.168.0.20:51719 |mytest | Sleep | 5 | | NULL



|220|root |192.168.0.20:51731 |mytest |Query | 84 | Locked |



select bookname,culture,value,type from book where id=001



先简单说一下各列的含义和用途,第一列,id,不用说了吧,一个标识,你要kill一个语句的时候很有用。user列,显示单前用户,如果不是root,这个命令就只显示你权限范围内的sql语句。host列,显示这个语句是从哪个ip的哪个端口上发出的。呵呵,可以用来追踪出问题语句的用户。db列,显示这个进程目前连接的是哪个数据库。command列,显示当前连接的执行的命令,一般就是休眠(sleep),查询(query),连接(connect)。time列,此这个状态持续的时间,单位是秒。state列,显示使用当前连接的sql语句的状态,很重要的列,后续会有所有的状态的描述,请注意,state只是语句执行中的某一个状态,一个sql语句,已查询为例,可能需要经过copying to tmp table,Sorting result,Sending data等状态才可以完成,info列,显示这个sql语句,因为长度有限,所以长的sql语句就显示不全,但是一个判断问题语句的重要依据。



这个命令中最关键的就是state列,mysql列出的状态主要有以下几种:



Checking table

正在检查数据表(这是自动的)。

Closing tables

正在将表中修改的数据刷新到磁盘中,同时正在关闭已经用完的表。这是一个很快的操作,如果不是这样的话,就应该确认磁盘空间是否已经满了或者磁盘是否正处于重负中。

Connect Out

复制从服务器正在连接主服务器。

Copying to tmp table on disk

由于临时结果集大于tmp_table_size,正在将临时表从内存存储转为磁盘存储以此节省内存。

Creating tmp table

正在创建临时表以存放部分查询结果。

deleting from main table

服务器正在执行多表删除中的第一部分,刚删除第一个表。

deleting from reference tables

服务器正在执行多表删除中的第二部分,正在删除其他表的记录。

Flushing tables

正在执行FLUSH TABLES,等待其他线程关闭数据表。

Killed

发送了一个kill请求给某线程,那么这个线程将会检查kill标志位,同时会放弃下一个kill请求。MySQL会在每次的主循环中检查kill标志位,不过有些情况下该线程可能会过一小段才能死掉。如果该线程程被其他线程锁住了,那么kill请求会在锁释放时马上生效。

Locked

被其他查询锁住了。

Sending data

正在处理Select查询的记录,同时正在把结果发送给客户端。

Sorting for group

正在为GROUP BY做排序。

Sorting for order

正在为ORDER BY做排序。

Opening tables

这个过程应该会很快,除非受到其他因素的干扰。例如,在执Alter TABLE或LOCK TABLE语句行完以前,数据表无法被其他线程打开。正尝试打开一个表。

Removing duplicates

正在执行一个Select DISTINCT方式的查询,但是MySQL无法在前一个阶段优化掉那些重复的记录。因此,MySQL需要再次去掉重复的记录,然后再把结果发送给客户端。

Reopen table

获得了对一个表的锁,但是必须在表结构修改之后才能获得这个锁。已经释放锁,关闭数据表,正尝试重新打开数据表。

Repair by sorting

修复指令正在排序以创建索引。

Repair with keycache

修复指令正在利用索引缓存一个一个地创建新索引。它会比Repair by sorting慢些。

Searching rows for update

正在讲符合条件的记录找出来以备更新。它必须在Update要修改相关的记录之前就完成了。

Sleeping

正在等待客户端发送新请求.

System lock

正在等待取得一个外部的系统锁。如果当前没有运行多个mysqld服务器同时请求同一个表,那么可以通过增加--skip-external-locking参数来禁止外部系统锁。

Upgrading lock

Insert DELAYED正在尝试取得一个锁表以插入新记录。

Updating

正在搜索匹配的记录,并且修改它们。

User Lock

正在等待GET_LOCK()。

Waiting for tables

该线程得到通知,数据表结构已经被修改了,需要重新打开数据表以取得新的结构。然后,为了能的重新打开数据表,必须等到所有其他线程关闭这个表。以下几种情况下会产生这个通知:FLUSH TABLES tbl_name, Alter TABLE, RENAME TABLE, REPAIR TABLE, ANALYZE TABLE,或OPTIMIZE TABLE。

waiting for handler insert

Insert DELAYED已经处理完了所有待处理的插入操作,正在等待新的请求。

大部分状态对应很快的操作,只要有一个线程保持同一个状态好几秒钟,那么可能是有问题发生了,需要检查一下。

还有其他的状态没在上面中列出来,不过它们大部分只是在查看服务器是否有存在错误是才用得着。



mysql手册里有所有状态的说明,链接如下:http://dev.mysql.com/doc/refman/5.0/en/general-thread-states.html
分享到:
评论

相关推荐

    linux抓取僵尸网络进程脚本

    linux抓取僵尸网络进程脚本

    linux中的僵尸进程

    3. **使用`kill`命令**:使用`kill -9`命令可以直接终止父进程,从而间接地清除僵尸进程。 #### 六、示例代码分析 下面是一个简单的示例代码,演示了如何创建僵尸进程: ```c #include #include #include #...

    LINUX查看和处理僵死进程

    僵死进程的出现可能是因为父进程没有正确地释放子进程的资源,导致子进程变成僵尸进程。有些ZOMBIE进程时用kill -9也不能杀死,而且消耗了很多系统资源不能释放,如果系统在shutdown时发出信息:some process wouldn...

    Linux 僵尸进程产生原因及解决方法

    为了遵循这些设计原则,不允许 Linux 内核在进程一终止后就丢弃包含在进程描述符字段中的数据。只有父进程发出了与被终止的进程相关的 wait() 类系统调用之后,才允许这样做。这就是引入僵死状态的原因:尽管从技术...

    消除僵尸进程的两种方法

    在操作系统(OS)中,僵尸进程是一个已终止但其父进程尚未从子进程接收状态信息的进程。这种状态是进程生命周期中的一个不寻常阶段,它可能会占用系统资源并导致不必要的混乱。本文将深入探讨消除僵尸进程的两种常用...

    僵尸进程介绍以及防范

    僵尸进程是计算机操作系统中的一种特殊状态,当一个进程执行完毕并退出,但其父进程尚未读取其退出状态时,这个已结束的进程就会成为僵尸进程。它的主要特征是进程已不再执行任何代码,但其进程描述符仍然存在于内存...

    oracle杀僵死进程

    在Oracle数据库管理过程中,经常会遇到僵死进程的问题,这些问题可能会导致数据库性能下降甚至无法正常运行。本文将详细介绍如何通过SQL查询定位僵死进程,并提供具体的解决方案,帮助解决如无法停库等异常问题。 #...

    Linux僵死进程的产生与避免.pdf

    Linux 操作系统中,僵死进程(Zombie Process)是一种特殊的进程状态,它是指一个进程已经终止,但是其父进程没有通过wait或waitpid函数来回收它的状态信息,而使得进程所占用的资源无法释放,导致系统资源的浪费。...

    在Linux系统中查看进程及杀死僵尸进程的方法.docx

    ### 在Linux系统中查看进程及杀死僵尸进程的方法 #### 一、引言 在Linux操作系统中,进程管理是一项重要的任务,它涉及到系统性能优化、故障排查等多个方面。本文将详细介绍如何使用`ps`命令来查看系统中的进程...

    Linux寻找和杀掉僵尸进程的命令和方法

    在Linux系统中,僵尸进程(Zombie Process)是一种常见的系统问题,它们通常是由父进程创建的子进程在完成任务后未能被父进程正确回收而遗留下来的。这些僵尸进程虽然不再执行任何操作,但仍然占据着系统资源,如...

    特殊进程之僵尸进程测试代码

    尽管僵尸进程占用的资源相对较小,但如果系统中积累了大量的僵尸进程,会浪费有限的PCB资源,影响系统的性能。此外,如果父进程忽略了子进程的退出状态,可能会导致信息丢失,因为子进程的退出状态只在父进程调用`...

    僵尸网络终端进程捕获python脚本(python版本3.7.3)

    下一代防火墙NGAF发现终端有访问僵尸网路的告警,该告警不定时出现,特编写脚本在终端运行,捕获哪个进程访问僵尸网络目的ip。适合读者:网络信息安全运营工程师,网络信息安全事件溯源等

    Shell脚本实现查杀子进程、僵尸进程

    在本文中,我们探讨了如何使用Shell脚本来查找并清理子进程和僵尸进程。僵尸进程是指已结束但其父进程尚未从内核中删除其进程描述符的进程,而子进程则是由其他进程(父进程)创建的进程。 首先,脚本接收一个参数...

    植物大战僵尸脚本1

    植物大战僵尸脚本1 植物大战僵尸脚本1是使用 Unity3D 引擎开发的一款 tower defense 游戏的脚本,主要实现了僵尸的选择、游戏的开始、阳光的自动掉落等功能。下面是对该脚本的详细解读。 1. 僵尸选择功能 在 ...

    「杀不掉的」僵尸(zombie)进程

    僵尸进程虽然不再占用CPU时间,但是仍然占用系统内存中的进程表条目,直到父进程通过调用`wait()`或`waitpid()`来释放它。 #### 二、僵尸进程的危害 僵尸进程虽然对系统的影响相对较小,但长时间存在也会造成一定...

    dumb-init完美处理docker进程,解决僵尸进程

    dumb-init 跨框架init初始化进程,有效回收僵尸进程

    Centos杀死进程kill方法大全.docx

    如果系统中有僵尸进程,并且其父进程是 init,而且僵尸进程占用了大量的系统资源,那么就需要在某个时候重启机器以清除进程表了。 根据不同的场景选择合适的方法来杀死进程,可以确保系统的稳定运行。

    Linux中僵尸进程和孤儿进程详解

    本文主要给大家介绍了关于Linux中僵尸进程和孤儿进程的相关内容,分享给出来供大家参考学习,下面来看看详细的介绍: 1、僵尸进程 一个子进程在其父进程没有调用wait()或waitpid()的情况下退出,这个子进程就是僵尸...

    Linux杀死僵尸进程.zip

    Linux杀死僵尸进程.zip 需要掌握的运维命令有ls、ps、free、top、uptime、ifconfig、susudo、dmesg、iostat、vmstat、sar、htop、iotop、smem等

Global site tag (gtag.js) - Google Analytics