曾经,如果你熟悉 strace 命令,那你一定被视为高手,而今 strace 已是家喻户晓的工具。当你遇到性能问题并寻求帮助时,大多数人会建议你使用 strace 进行跟踪。然而,面对屏幕上滚动的字符,往往很难找出问题的根源。本文通过一个实际案例,展示在使用 strace 进行问题诊断时的一些技巧。
以下是一个真实案例,相似之处纯属巧合!我们来看一下一台高负载服务器的 top 结果:
top
提示:在运行 top 时,按「1」键可查看 CPU 列表,按「shift+p」键按 CPU 使用率排序。
在本例中,我们可以轻易发现 CPU 主要被多个 PHP 进程占用,同时这些 PHP 进程也占用了相当多的内存,但系统内存尚有剩余,SWAP 使用情况也不严重,这并不是问题的主要原因。
然而,在 CPU 列表中我们可以看到,CPU 主要消耗在内核态「sy」而不是用户态「us」,这与我们的经验不符。Linux 操作系统中有许多用于跟踪程序行为的工具,内核态的函数调用跟踪使用「strace」,用户态的函数调用跟踪使用「ltrace」。因此,这里我们应该使用「strace」:
shell> strace -p <pid>
但如果直接使用 strace 跟踪某个进程,往往会面对满屏滚动的字符,从中找出问题的症结并不容易。幸运的是,strace 可以按操作汇总时间:
shell> strace -cp <pid>
通过「c」选项可以汇总各个操作的总耗时,运行后的结果大致如下图所示:
strace -cp
很明显,我们可以看到 CPU 主要被 clone 操作消耗了,我们可以单独跟踪 clone 操作:
shell> strace -T -e clone -p <pid>
通过「T」选项可以获取操作的实际耗时,通过「e」选项可以跟踪某个特定操作:
strace -T -e clone -p
显然,一个 clone 操作需要几百毫秒,关于 clone 的含义,可以参考 man 文档:
简单来说,就是创建一个新进程。那么在 PHP 中,什么时候会出现这种系统调用呢?在检查业务代码时发现了 exec 函数,通过如下命令验证它确实会导致 clone 系统调用:
shell> strace -eclone php -r 'exec("ls");'
最后,再给大家出个题:如果我们用 strace 跟踪一个进程,输出结果很少,是不是说明进程很空闲?其实试试 ltrace,可能会发现别有洞天。记住,内核态和用户态是有区别的。
以上就是手把手教你用Strace诊断问题的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号