今天我将逐步向您展示一个使用 OpenResty XRay 分析 Erlang/OTP 应用的例子。我们将快速定位一个已经在运行的 Erlang 进程中最热的代码路径。这些代码路径消耗最多的 CPU 时间,会影响您应用的性能。OpenResty XRay 可以同时分析 Erlang 语言层面和更底层的 Beam 虚拟机的 C 语言层面。OpenResty XRay 是真正的非侵入式动态分析,无需在目标应用中安装任何特殊模块或插件,无需重新编译目标应用,甚至无需重启已经在运行的进程。

问题:高 CPU 使用率

先运行 top 命令来检查目标进程的 CPU 使用情况。

Screenshot

可以看到,这个进程消耗超过 200% 的 CPU 资源。

Screenshot

它名为 rebar3,是管理和构建 Erlang 项目的工具,这里我们用来启动项目。

Screenshot

运行 ps 命令来查看这个进程的详情。

Screenshot

这个 rebar3 二进制可执行文件是 Linux 发行版自带的。这个程序自然也是用标准发行版自带的 Erlang 编译的。

Screenshot

使用引导式分析功能定位 CPU 最热的 Erlang 代码路径

让我们使用 OpenResty XRay 来检查这个未经修改的进程。您可以对它进行实时分析,并找出原因。

在浏览器中打开 OpenResty XRay 的 Web 控制台。

Screenshot

确保我们当前分析的是正确的机器。

Screenshot

如果当前显示的机器不对,您可以从下面的列表中选择一个正确的。

Screenshot

进入 “Guided Analysis” 页面。

Screenshot

这里可以看到系统能分析的不同类型的问题。

Screenshot

让我们选择 “High CPU Usage”。

Screenshot

点击 “Next”。

Screenshot

选择之前的 Erlang 应用实例。

Screenshot

选择消耗接近 200% CPU 资源的进程。也就是我们之前在 top 中看到的。

Screenshot

确保应用的类型是正确的。通常默认值就是对的。

Screenshot

OpenResty XRay 可以在多种不同语言的级别上进行分析。这里保持 Erlang 和 C/C++ 都选中。

Screenshot

我们还可以设置最长的分析时间。这里保持默认的 300 秒不变。

Screenshot

开始分析。

Screenshot

系统将持续执行多轮分析。现在它正在运行第一轮分析。

Screenshot

第一轮已经完成,现在进入第二轮分析。对这个例子来说,运行一轮就够了。

Screenshot

停止分析。

Screenshot

可以看到自动生成了一份分析报告。

Screenshot

这是现在我们要分析的问题类型,CPU。

Screenshot

这条是占用 CPU 时间最多的 Erlang 代码路径。

Screenshot

check_resp_content 函数是用于检查内容的业务函数。

Screenshot

它调用了 lists 模块的 filter 函数对列表进行过滤筛选。

Screenshot

而筛选条件是一个匿名函数,这个匿名函数内使用正则表达式匹配。这些调用都发生在 check_resp_content 函数内。

Screenshot

点击查看更多。

Screenshot

这条热代码路径是由这个 Erlang 语言级别的 CPU 火焰图自动推导出来的。

Screenshot

这是对问题更详细的解释和建议。

Screenshot

回到之前的热代码路径。将鼠标悬停在这个函数的绿框上。在提示框中可以看到它的源文件路径。

Screenshot

Erlang 源码的行号是 15。

Screenshot

点击复制源文件路径。

Screenshot

使用 Vim 编辑器打开 Erlang 源文件。您可以使用任何您喜欢的编辑器。

Screenshot

按照 OpenResty XRay 的建议,跳转到第 15 行。

Screenshot

这是 re 模块的 run 函数。

Screenshot

这是我们之前看到的 lists:filter 函数调用。

Screenshot

这行代码确实在函数 check_resp_content 中。您可以通过优化这里的正则,避免正则引擎进行代价高昂的回溯操作。或者改用非回溯的正则引擎。

Screenshot

这两条代码路径类似,都是在执行正则匹配。

Screenshot

第三条路径是在计算字符串的长度。

Screenshot

iolist 是要匹配的输入字符串,erts_iolist_size 就是在计算待匹配字符串的长度。

Screenshot

这里的 Content 就是待匹配的输入字符串。

Screenshot

回到 Web 控制台。看一下这条占用 CPU 时间最多的 C++ 代码路径。C++ 语言级别的分析显示了 Erlang 的 Beam 虚拟机层面的性能热点。

Screenshot

这个名为 match 的 C 函数是 PCRE 库中负责执行正则匹配的函数。

Screenshot

erts_pcre_exec 函数是 Erlang 运行时对 PCRE 库中的 pcre_exec 函数的封装。

Screenshot

re_run 是 Erlang 中 re 模块用于执行正则匹配的函数。

Screenshot

这个 16 进制地址表示这个代码路径是在 JIT 编译 Erlang 代码中执行的。

Screenshot

全自动分析与报告

OpenResty XRay 也可以自动监控在线进程,并生成分析报告。切换到 “Insights” 页面。

Screenshot

您可以在 “Insights” 页面中找到以日和周为周期的报告。所以您不是非得用 “Guided Analysis” 功能。

Screenshot

当然,“Guided Analysis” 对于应用的开发和演示是很有用的。

Screenshot

如果您喜欢这个教程,请订阅这个博客网站和我们的 YouTube 频道B 站频道。谢谢!

关于 OpenResty XRay

OpenResty XRay 是一个动态追踪产品,它可以自动分析运行中的应用,以解决性能问题、行为问题和安全漏洞,并提供可行的建议。在底层实现上,OpenResty XRay 由我们的 Y 语言驱动,可以在不同环境下支持多种不同的运行时,如 Stap+、eBPF+、GDB 和 ODB。

关于作者

章亦春是开源 OpenResty® 项目创始人兼 OpenResty Inc. 公司 CEO 和创始人。

章亦春(Github ID: agentzh),生于中国江苏,现定居美国湾区。他是中国早期开源技术和文化的倡导者和领军人物,曾供职于多家国际知名的高科技企业,如 Cloudflare、雅虎、阿里巴巴, 是 “边缘计算“、”动态追踪 “和 “机器编程 “的先驱,拥有超过 22 年的编程及 16 年的开源经验。作为拥有超过 4000 万全球域名用户的开源项目的领导者。他基于其 OpenResty® 开源项目打造的高科技企业 OpenResty Inc. 位于美国硅谷中心。其主打的两个产品 OpenResty XRay(利用动态追踪技术的非侵入式的故障剖析和排除工具)和 OpenResty Edge(最适合微服务和分布式流量的全能型网关软件),广受全球众多上市及大型企业青睐。在 OpenResty 以外,章亦春为多个开源项目贡献了累计超过百万行代码,其中包括,Linux 内核、Nginx、LuaJITGDBSystemTapLLVM、Perl 等,并编写过 60 多个开源软件库。

关注我们

如果您喜欢本文,欢迎关注我们 OpenResty Inc. 公司的博客网站 。也欢迎扫码关注我们的微信公众号:

我们的微信公众号

翻译

我们提供了英文版原文和中译版(本文)。我们也欢迎读者提供其他语言的翻译版本,只要是全文翻译不带省略,我们都将会考虑采用,非常感谢!