关于nginx信号控制的“故障”案例
最近几天发现nginx的日志老切割不成功,遂来查找问题。
最开始以为是logrotate的脚本问题,遂手动切割,运行以下的命令
- logrotate -vf /etc/logrotate.d/nginx
发现运行这个是没有问题的,终于,在service nginx restart后,发现了问题
问题是在用service nginx restart后,nginx.pid文件才会自动消失,于是,仔细检查脚本,发现一些端倪啊,一个字眼出现了
- killproc $prog -QUIT
-QUIT从容关闭,也就是说这个进程是慢慢关闭的,不是立即关闭的,于是验证。如图
查看进程如下
可以看到,nginx正在shutdown之中,但没有一下子全部关闭了。
随着时间的推移,nginx老的进程在继续关闭中……
到最后,nginx之前的老进程全部关闭……
这时,nginx.pid文件没有了
到此,nginx.pid文件神奇消失的问题终于被找出来了。
继续分析-----日志分割,依靠的是nginx.pid获取nginx的进程号,分割成功后,出现的情况是nginx依然昨天的日志,不写分割后的日志。
那么现在需要对这个脚本进行修改,把stop函数中的-QUIT改为-TERM 立即关闭。(话说我这个脚本是来自官网改造的,看来官网也不是100%的准确哦,做运维要细心啊)
官方脚本地址
再次运用此脚本重启
- service nginx restart
问题不再重现,已经解决了。
总结,一个小小的参数,可能会引发无限大的问题,所以,学知识要细心啊!
=============================================================
附录一:nginx的信号控制
- TERM,INT 快速关闭;
- QUIT 从容关闭
- HUP 平滑重启,重新加载配置文件;
- USER1 重新打开日志文件,在切割日志的时候用途较大;
- USER2 平滑升级可执行程序;
- WINCH 从容关闭工作进程;
附录二:nginx的启动脚本如下
- #!/bin/sh
- #
- # nginx - this script starts and stops the nginx daemon
- #
- # chkconfig: - 85 15
- # description: Nginx is an HTTP(S) server, HTTP(S) reverse \
- # proxy and IMAP/POP3 proxy server
- # processname: nginx
- # config: /etc/nginx/nginx.conf
- # config: /etc/sysconfig/nginx
- # pidfile: /var/run/nginx.pid
-
- # Source function library.
- #. /etc/rc.d/init.d/functions
-
- # Source networking configuration.
- #. /etc/sysconfig/network
-
- # Check that networking is up.
- green='\e[0;32m'
- red='\e[0;31m'
- NC='\e[0m'
-
- nginx="/usr/sbin/nginx"
- prog=$(basename $nginx)
-
- NGINX_CONF_FILE="/etc/nginx/nginx.conf"
- pidfile="/var/run/nginx.pid"
- lockfile=/var/lock/subsys/nginx
-
- make_dirs() {
- # make required directories
- user=`$nginx -V 2>&1 | grep "configure arguments:" | sed 's/[^*]*--user=\([^ ]*\).*/\1/g' -`
- if [ -z "`grep $user /etc/passwd`" ]; then
- useradd -M -s /bin/nologin $user
- fi
- options=`$nginx -V 2>&1 | grep 'configure arguments:'`
- for opt in $options; do
- if [ `echo $opt | grep '.*-temp-path'` ]; then
- value=`echo $opt | cut -d "=" -f 2`
- if [ ! -d "$value" ]; then
- # echo "creating" $value
- mkdir -p $value && chown -R $user $value
- fi
- fi
- done
- }
-
- start() {
- [ -x $nginx ] || exit 5
- [ -f $NGINX_CONF_FILE ] || exit 6
- make_dirs
- echo -e "Starting $prog ...................................\c"
- $nginx -c $NGINX_CONF_FILE >/dev/null 2>&1
- retval=$?
- echo
- [ $retval -eq 0 ] && touch $lockfile && echo -e "Started $prog ...................................[ ${green}OK${NC} ]"
- [ $retval != 0 ] && echo -e "Started $prog ................................[ ${red}Falied${NC} ]\r"
- return $retval
- }
-
- stop() {
- echo -e "Stopping $prog ...................................\c"
- PID=`cat $pidfile`
- killproc $prog -TERM
- retval=$?
- echo
- [ $retval -eq 0 ] && rm -f $lockfile && echo -e "Stoped $prog ...................................[ ${green}OK${NC} ]\r"
- [ $retval != 0 ] && echo -e "Stoped $prog ................................[ ${red}Falied${NC} ]\r"
- return $retval
- }
- status(){
- if [ -e $pidfile ]
- then
- PID=`cat $pidfile`
- echo "Nginx (pid $PID) is running..."
- else
- echo "Nginx is stopped"
- fi
- }
-
- restart() {
- configtest || return $?
- stop
- sleep 1
- start
- }
-
- reload() {
- configtest || return $?
- echo -n $"Reloading $prog: "
- killproc $nginx -HUP
- RETVAL=$?
- echo
- }
-
- configtest() {
- $nginx -t -c $NGINX_CONF_FILE >/dev/null 2>&1
- }
-
- case "$1" in
- start)
- $1
- ;;
- stop)
- $1
- ;;
- status)
- $1
- ;;
- restart)
- $1
- ;;
- reload)
- $1
- ;;
- configtest)
- $1
- ;;
- *)
- echo $"Usage: $0 {start|stop|status|restart|reload|configtest}"
- exit 2
- esac
附录三:日志切割脚本如下
- # cat /etc/logrotate.d/nginx
- /var/log/nginx/*.log {
- daily
- rotate 7
- missingok
- create 600 www www
- notifempty
- sharedscripts
- postrotate
- if [ -f /var/run/nginx.pid ]; then
- kill -USR1 $(cat /var/run/nginx.pid)
- fi
- endscript
- }
本文转自it你好 51CTO博客,原文链接:http://blog.51cto.com/itnihao/957631,如需转载请自行联系原作者