参考:
https://www.toutiao.com/i6826310485114094091/
http://www.phpmianshi.com/?id=84
青铜 var_dump/die打印变量值信息单步调试
是最简单粗暴有效的解决问题方法。高级一点的是使用打印日志。
白银 会设置各种错误日志的记录和显示,并根据各种错误日志分析错误或者搜索别人的解决方案
php.ini 设置错误记录
display_errors = On error_reporting = E_ALL | E_STRICT error_log = /data/wwwlogs/php_errors.log display_startup_errors = On log_errors = On
php-fpm.conf 设置错误日志记录并记录慢日志
error_log = /data/wwwlogs/php-fpm.error.log log_level = warning request_slowlog_timeout = 1 slowlog = /data/wwwlogs/php-fpm.slow.log
nginx 设置错误日志记录
error_log /data/wwwlogs/error_nginx.log crit;
查看linux系统日志
tail -f /var/log/messages
能熟练根据各种错误日志排查问题,基本已经可以解决大部分的异常问题。
铂金 存在多个版本的php或php-cli与php-fpm加载不同的配置
存在多个版本的php,懂得通过which php来看是哪个PHP。
当php-cli与php-fpm得到的执行情况不一样,php-cli下可以通过php -i |grep php.ini看加载了哪个php.ini。
fpm下通过phpinfo()函数可以看加载了哪个php.ini。
钻石 使用strace/tcpdump工具跟踪程序或抓包
strace可以用来查看系统调用的执行,使用strace php test.php,或者strace -p 进程ID。strace就可以帮助你透过现象看本质,掌握程序执行的过程。这个手段是在大型网站,大公司里最常用的。如果当然strace对于PHP 代码里的死循环是解决不了的。比如你发现一个php-fpm进程CPU100%了,strace恐怕是解决不了的。因为strace是看系统调用,一般都 是IO类操作,既然是IO密集,那CPU一定不可能是100%。
tcpdump可以抓到网卡的数据通信过程,甚至数据内容也可以抓到。使用tcpdump可以看到网络通信过程是什么样的,如何时发起了TCP SYN3次握手,何时发送FIN包,何时发送RST包。这是一个基本功,如果不懂tcpdump,证明不具备网络问题解决能力。
星耀 统计函数调用的耗时和成功率,分析系统慢的主要原因
使用xhporf/xdebug导出PHP请求的调用过程,然后分析每个函数调用的过程和耗时。能够分析PHP程序的性能瓶颈,找出可以优化的点。
另外一个对于网络服务的调用,如mysql查询,curl,其他API调用等,通过记录起始和结束时microtime,返回的是不是false, 可以得到调用是否成功,耗时多少。
通过nginx access.log 找到返回慢的主要接口:
查询接口响应时间大于1秒的请求数量
grep user_msg.php access.log |grep POST |awk -F'up_resp_time' '{print $2}' |awk -F'\"' '$3>1{print $3}'|wc -l
通过php-fpm.slow.log 查看接口什么地方调用比较慢:
查询慢的函数调用比例:
grep -E 'script_filename.*user_msg' -A 3 php-fpm.slow.log | awk '{print $2}' |grep -v = |sort |uniq -c
王者 gdb使用
gdb是C/C++调试程序的利器,需要具备一定C/C++功底的程序员才会能熟练使用gdb。上面说的strace无法跟踪php程序CPU100%,而gdb是可以跟踪的。另外gdb也可以解决php程序core dump的问题。