今天我将向您展示如何使用 OpenResty XRay 快速定位一些阻塞性的 Python 代码路径。这些代码可能导致您的进程变慢并使它们不能充分利用 CPU 资源。

问题: CPU 使用率上不去

让我们运行 top 命令来检查每个进程的 CPU 使用情况。

可以看到这个 gunicorn python 进程的 CPU 使用率非常低,只有 12%。即使有很多请求进来,它也不会上升。

Screenshot

让我们运行 ps 命令来查看这个进程的更多细节。

这里我们可以看到,这个进程使用的是 Linux 发行版自带的标准 Python 3 二进制可执行文件。

Screenshot

来看一下这个 Python web 应用程序的访问日志。

可以看到,有很多客户端请求进来,但是 CPU 使用率仍然很低。这意味着有一些东西阻塞了 Python 代码高效地运行。我们怎么才能找出来阻塞的东西到底是什么呢?

Screenshot

使用 OpenResty XRay 的引导式分析功能定位最占有 off-CPU 时间的 Python 代码路径

我们可以使用 OpenResty XRay 来检查这个未经修改的进程。我们可以对它进行实时分析,弄清楚到底发生了什么事。

在浏览器中打开 OpenResty XRay web 控制台。

Screenshot

确保您正在分析的是正确的机器。

Screenshot

跳转到“引导式分析”页面。

Screenshot

这里您可以看到 OpenResty XRay 可以分析的不同类型的问题。

Screenshot

选择 “Low CPU usage and cannot go up”。

Screenshot

点击“下一步”。

Screenshot

选择 Python 应用程序。

Screenshot

选择消耗 10% CPU 资源的进程。也就是我们之前在 top 中看到的。

Screenshot

确保应用程序类型是正确的。

通常默认值就应该是正确的。

Screenshot

OpenResty XRay 可以同时分析多种语言级别。我们保持 Python 和 C 都选中的状态。

Screenshot

这里还可以设置最大分析时间。我们保留 300 秒不变,这是默认值。

Screenshot

开始分析。

Screenshot

系统将持续进行多轮分析。现在它正在执行第一轮分析。

Screenshot

第一轮分析完成了,现在已经进入到第二轮分析了。对于这个案例来说,两轮分析已经足够了。

Screenshot

现在停止分析。

Screenshot

可以看到自动创建了一个报告。

Screenshot

这是阻塞 CPU 高效运行的 C 代码路径。

Screenshot

第一个函数是 poll 系统调用。它意味着 Python 解释器正在等待 I/O 事件。但是它在等待什么样的 I/O 事件呢?要找出这个信息,我们需要更多的上下文线索。

Screenshot

_PyEval_EvalFrameDefault 函数表示当前正在运行一些 Python 代码。

Screenshot

然后我们看看排名第一的 off-CPU Python 代码路径。

Screenshot

看看这个 Python run 函数,它是在标准的 subprocess.py 模块文件中定义的。这意味着 Python 代码正在运行一个子进程命令,并等待它的输出。

Screenshot

函数 “handle_by_script” 是在我们的业务级 Python 代码库中。

Screenshot

点击查看更多细节。

Screenshot

最重要的阻塞性代码路径是从这个 Python-land off-CPU 火焰图中自动推导出来的。火焰图展示了一个整体的状况。

Screenshot

下面是关于当前问题的更详细的解释和建议。

Screenshot

它谈到了我们之前看到的 handle_by_script 函数。

Screenshot

也提到了这个函数运行了一个子进程。

Screenshot

将鼠标悬停在名为 handle_by_script 的绿色框上的 Python 函数上。

Screenshot

可以看到这个函数的 Python 源文件。并且,在提示框中可以看到 processor.py 文件的完整路径。

Screenshot

源代码行号是 12。

Screenshot

点击图标复制这个函数的完整 Python 源文件路径。

Screenshot

使用 vim 编辑器,粘贴我们刚刚复制的代码路径,查看相应的业务 Python 代码。您可以使用任何您喜欢的编辑器。

Screenshot

正如 OpenResty XRay 建议的那样跳转到第 12 行。

Screenshot

可以看到,这个 Python 代码行确实是调用了 subprocess.run 函数。

Screenshot

它也在之前报告中显示的函数 handle_by_script 中。

Screenshot

全自动分析与报告

OpenResty XRay 也可以自动监控在线进程,并显示分析报告。

Screenshot

跳转到 Insights 页面。

Screenshot

您可以在 Insights 页面中找到以日和周为周期的报告。

Screenshot

所以您不一定非要使用引导式分析功能。尽管引导式分析对于应用程序的开发和演示很有用。

Screenshot

关于 OpenResty XRay

OpenResty XRay 是一个动态追踪产品,它可以自动分析运行中的应用程序,以解决性能问题、行为问题和安全漏洞,并提供可行的建议。在底层实现上,OpenResty XRay 由我们的 Y 语言驱动,可以在不同环境下支持多种不同的运行时,如 Stap+、eBPF+、GDB 和 ODB。

关于本文和关联视频

本文和相关联的视频都是完全由我们的 OpenResty Showman 产品从一个简单的剧本文件自动生成的。

关于作者

章亦春是开源 OpenResty® 项目创始人兼 OpenResty Inc. 公司 CEO 和创始人。

章亦春(Github ID: agentzh),生于中国江苏,现定居美国湾区。他是中国早期开源技术和文化的倡导者和领军人物,曾供职于多家国际知名的高科技企业,如 Cloudflare、雅虎、阿里巴巴, 是 “边缘计算“、”动态追踪 “和 “机器编程 “的先驱,拥有超过 22 年的编程及 16 年的开源经验。作为拥有超过 4000 万全球域名用户的开源项目的领导者。他基于其 OpenResty® 开源项目打造的高科技企业 OpenResty Inc. 位于美国硅谷中心。其主打的两个产品 OpenResty XRay(利用动态追踪技术的非侵入式的故障剖析和排除工具)和 OpenResty Edge(最适合微服务和分布式流量的全能型网关软件),广受全球众多上市及大型企业青睐。在 OpenResty 以外,章亦春为多个开源项目贡献了累计超过百万行代码,其中包括,Linux 内核、Nginx、LuaJITGDBSystemTapLLVM、Perl 等,并编写过 60 多个开源软件库。

关注我们

如果您喜欢本文,欢迎关注我们 OpenResty Inc. 公司的博客网站 。也欢迎扫码关注我们的微信公众号:

我们的微信公众号

翻译

我们提供了英文版原文和中译版(本文)。我们也欢迎读者提供其他语言的翻译版本,只要是全文翻译不带省略,我们都将会考虑采用,非常感谢!