线上快速定位阻塞线程的 Perl 代码路径(使用 OpenResty XRay)
今天我将向您展示如何使用 OpenResty XRay 快速定位一些阻塞操作系统线程的 Perl 代码路径。这些代码会导致您的进程变慢并使它们不能充分利用 CPU 资源。
问题:CPU 使用率上不去
首先运行 top
命令检查 CPU 的使用情况。
可以看到这个名为 Perl 的进程。它的 CPU 只有 13% 左右。即使有很多请求进来,CPU 用量也不会上升。
让我们运行 ps
命令来查看这个进程的更多细节。
这里我们可以看到,它是 Linux 发行版自带的标准 perl 二进制可执行文件。
接下来我们来看一下这个 Perl 应用的访问日志。
可以看到,有很多客户端请求正在涌入,但是 CPU 使用率仍然很低。这意味着有一些东西阻塞了 Perl 代码高效运行。我们怎么才能找到原因呢?
使用 OpenResty XRay 的引导式分析功能定位 off-CPU 时间占比最大的 Perl 代码路径
让我们使用 OpenResty XRay 来检查这个未经修改的进程。我们可以对它进行实时分析,并找出原因。
在浏览器中打开 OpenResty XRay 的 Web 控制台。
确保我们当前分析的是正确的机器。
如果当前显示的机器不对,您可以从下面的列表中选择一个正确的。
进入”Guided Analysis“页面。
这里可以看到系统能分析的不同类型的问题。
选择 “Low CPU usage and cannot go up“。
点击 “下一步”。
选择之前的 Perl 应用。
选择消耗 14% CPU 资源的进程。也就是我们之前在 top
中看到的。
确保应用程序的类型是正确的。通常默认值就是对的。
OpenResty XRay 可以同时分析多种语言级别。这里保持 Perl 和 C/C++ 都选中的状态。
我们还可以设置最大分析时间。这里保持默认的 300 秒不变。
开始分析。
系统将持续执行多轮分析。现在它正在运行第一轮分析。
第一轮分析已经完成,现在进入第二轮分析。对这个例子来说,运行一轮分析就够了。
现在停止分析。
可以看到已经自动生成了一份分析报告。
这是现在我们要分析的问题类型,off-CPU。
这是阻塞操作系统线程最严重的 C 代码路径。
第一个函数是 select
,一个系统调用函数。
Perl_pp_select
是处理 Perl 中 select
函数的内置函数。它是 Perl 内部的一部分,用于监视和等待 socket 以及其他文件上的 I/O 事件。
从这个 C 函数可以看到当前正在执行 Perl 代码。
接下来,我们看看阻塞最严重的 Perl 代码路径。
最顶部的 C 函数 select
正是我们刚才看到的 C 代码路径中的阻塞点。
Net::HTTP::Methods 模块的 can_read
Perl 函数会等待直到 socket 接收到可读取的新数据。
沿着调用链,我们可以看到它在读取 read_response_headers
函数中的响应头时发生了阻塞。
remote_fetch
是业务级别代码中的一个函数,它属于我们自己的 Perl 模块 Service::Processor。
最显著的阻塞性代码路径是从这个 Perl 语言级别的 off-CPU 火焰图中自动推导出来的。
这里是对当前问题更详细的解释和建议。
这里提到了我们前面看到的 select
函数。
这里提到 Net::HTTP::Methods::can_read 函数使用 select
调用根据数据进行下一步。
这也是我们之前看到的 remote_fetch
函数的引用。
让我们回到之前的热代码路径。
把鼠标放在名为 remote_fetch
的 Perl 函数的绿色框上。
可以看到这个函数的 Perl 源文件的完整路径。
点击复制这个函数完整的 Perl 源文件路径。
在终端上粘贴我们刚刚复制的代码路径,使用 vim 编辑器查看相应的 Perl 业务代码。您可以使用任何您喜欢的编辑器。
正如 OpenResty XRay 建议的那样跳转到第 66 行。
我们可以看到它正在发送 HTTP GET 请求并等待其响应。
为了避免在 Perl 中阻塞 HTTP 请求,您可以考虑使用像 Coro 这样的非阻塞框架。
全自动分析与报告
OpenResty XRay 也可以自动监控在线进程,并显示分析报告。
跳转到”Insights“页面。
您可以在“Insights“页面中找到以日和周为周期的报告。其实您不是非得用“Guided Analysis“功能。
当然“Guided Analysis“对于应用程序的开发和演示是很有用的。
如果你喜欢这个教程,请订阅这个博客网站和我们的 YouTube 频道 或 B 站频道。谢谢!
关于 OpenResty XRay
OpenResty XRay 是一个动态追踪产品,它可以自动分析运行中的应用,以解决性能问题、行为问题和安全漏洞,并提供可行的建议。在底层实现上,OpenResty XRay 由我们的 Y 语言驱动,可以在不同环境下支持多种不同的运行时,如 Stap+、eBPF+、GDB 和 ODB。
关于作者
章亦春是开源 OpenResty® 项目创始人兼 OpenResty Inc. 公司 CEO 和创始人。
章亦春(Github ID: agentzh),生于中国江苏,现定居美国湾区。他是中国早期开源技术和文化的倡导者和领军人物,曾供职于多家国际知名的高科技企业,如 Cloudflare、雅虎、阿里巴巴, 是 “边缘计算“、”动态追踪 “和 “机器编程 “的先驱,拥有超过 22 年的编程及 16 年的开源经验。作为拥有超过 4000 万全球域名用户的开源项目的领导者。他基于其 OpenResty® 开源项目打造的高科技企业 OpenResty Inc. 位于美国硅谷中心。其主打的两个产品 OpenResty XRay(利用动态追踪技术的非侵入式的故障剖析和排除工具)和 OpenResty Edge(最适合微服务和分布式流量的全能型网关软件),广受全球众多上市及大型企业青睐。在 OpenResty 以外,章亦春为多个开源项目贡献了累计超过百万行代码,其中包括,Linux 内核、Nginx、LuaJIT、GDB、SystemTap、LLVM、Perl 等,并编写过 60 多个开源软件库。
关注我们
如果您喜欢本文,欢迎关注我们 OpenResty Inc. 公司的博客网站 。也欢迎扫码关注我们的微信公众号:
翻译
我们提供了英文版原文和中译版(本文)。我们也欢迎读者提供其他语言的翻译版本,只要是全文翻译不带省略,我们都将会考虑采用,非常感谢!