このチュートリアルでは、OpenResty XRay が Python アプリケーションを追跡する際のパフォーマンスへの実際の影響について説明します。OpenResty XRay がターゲットシステムのサンプリングと分析を行う際の CPU、メモリ、平均負荷、トラフィックスループット、リクエストレイテンシーなどを観察します。OpenResty XRay は、当社独自の動的トレース技術に基づく非侵襲型診断システムです。パフォーマンスオーバーヘッドが極めて小さく、実行中のアプリケーションをリアルタイムで分析し、様々な問題の根本原因を特定することができます。

アナライザー実行前のアプリケーションパフォーマンス

まず、top コマンドを実行してプロセスリストを確認します。

現時点では、OpenResty XRay の Agent は分析を実行していません。そのため、ターゲットプロセスへのパフォーマンスの影響は厳密にゼロです。これは動的トレース技術のおかげです。ターゲットプロセスに対して一切の変更を加えることはありません。

Screenshot

Python 言語で書かれた gunicorn というプロセスが確認できます。

Screenshot

CPU 使用率は約 46.5% となっています。

Screenshot

過去 1 分間の平均負荷は 0.7 です。

Screenshot

現在の CPU アイドル率は約 87.2% です。

Screenshot

現在の利用可能なメモリは約 2632MB です。

Screenshot

OpenResty XRay を実行して、この Python プロセスをアクティブに分析してみましょう。これにより、対象のパフォーマンスへの影響を確認することができます。

Screenshot

アナライザー実行中のパフォーマンスへの影響

ブラウザで OpenResty XRay の Web コンソールを開きます。

Screenshot

現在分析している対象マシンが正しいことを確認します。

Screenshot

プロダクションモードは、本番環境の分析に使用されます。このモードでは、対象アプリケーションとサーバーのパフォーマンスへの影響を最小限に抑えます。ただし、分析時間が長くなる可能性があります。

Screenshot

「Guided Analysis」ページに移動します。

Screenshot

「High CPU usage」を選択します。

Screenshot

「Next」をクリックします。

Screenshot

Python アプリケーションを選択します。

Screenshot

CPU リソースの 47% を消費しているプロセスを選択します。これは以前 top で確認したものです。

Screenshot

分析を開始します。システムは複数のラウンドで分析を継続します。

Screenshot

300 秒、つまり 5 分間のサンプリングを継続します。

Screenshot

現在の CPU 使用率は 48% で、約 1.5% しか増加していないことがわかります。

Screenshot

過去 1 分間の平均負荷値は現在 0.84 で、以前の 0.7 から 0.14 増加しています。

Screenshot

CPU のアイドル率は 86.7% で、以前の 87.2% に近い値となっています。

Screenshot

現在の利用可能メモリは約 2631MB で、1MB ほど減少しています。以前と比較して顕著な変化はありません。

Screenshot

アナライザー実行時のスループットとレイテンシーへの実際の影響測定

サーバーの最大スループットを異なる条件下で測定しました。以下が調査結果です:

Screenshot

OpenResty XRay の Agent がインストールされていない場合、最大スループットは約 2300 リクエスト/秒でした。

Screenshot

Agent がインストールされているがアナライザーが実行されていない場合、最大スループットは変わりませんでした。

Screenshot

アナライザーがサンプリング中の場合、最大スループットは約 2220 RPS で、サンプリングを行っていない場合と比べてわずか 3.4% の低下でした。アナライザーの実行が対象プロセスの最大スループットに与える影響が極めて小さいことがわかります。

Screenshot

このパフォーマンステストは、サンプリング中のリクエスト遅延への影響を示しています。以下がデータ比較後の発見です。

Screenshot

OpenResty XRay の Agent がインストールされていない場合、平均リクエスト遅延は 4.32 ミリ秒でした。

Screenshot

Agent がインストールされているがアナライザーが実行されていない場合、平均リクエスト遅延に変化はありませんでした。

Screenshot

アナライザーが実行中の場合、リクエスト遅延は 4.48 ミリ秒になりました。わずか 0.16 ミリ秒の増加です。これは、アナライザーの実行が対象プロセスのリクエスト遅延に与える影響も極めて小さいことを証明しています。

Screenshot

「Insights」や「Dashboard」ページでの自動分析の処理負荷も非常に低く、先ほど確認したものと同様の水準となっています。

Screenshot

OpenResty XRay について

OpenResty XRay動的トレーシング製品であり、実行中のアプリケーションを自動的に分析して、パフォーマンスの問題、動作の問題、セキュリティの脆弱性を解決し、実行可能な提案を提供いたします。基盤となる実装において、OpenResty XRay は弊社の Y 言語によって駆動され、Stap+、eBPF+、GDB、ODB など、様々な環境下で複数の異なるランタイムをサポートしております。

著者について

章亦春(Zhang Yichun)は、オープンソースの OpenResty® プロジェクトの創始者であり、OpenResty Inc. の CEO および創業者です。

章亦春(GitHub ID: agentzh)は中国江蘇省生まれで、現在は米国ベイエリアに在住しております。彼は中国における初期のオープンソース技術と文化の提唱者およびリーダーの一人であり、Cloudflare、Yahoo!、Alibaba など、国際的に有名なハイテク企業に勤務した経験があります。「エッジコンピューティング」、「動的トレーシング」、「機械プログラミング」 の先駆者であり、22 年以上のプログラミング経験と 16 年以上のオープンソース経験を持っております。世界中で 4000 万以上のドメイン名を持つユーザーを抱えるオープンソースプロジェクトのリーダーとして、彼は OpenResty® オープンソースプロジェクトをベースに、米国シリコンバレーの中心部にハイテク企業 OpenResty Inc. を設立いたしました。同社の主力製品である OpenResty XRay動的トレーシング技術を利用した非侵襲的な障害分析および排除ツール)と OpenResty XRay(マイクロサービスおよび分散トラフィックに最適化された多機能ゲートウェイソフトウェア)は、世界中の多くの上場企業および大企業から高い評価を得ております。OpenResty 以外にも、章亦春は Linux カーネル、Nginx、LuaJITGDBSystemTapLLVM、Perl など、複数のオープンソースプロジェクトに累計 100 万行以上のコードを寄与し、60 以上のオープンソースソフトウェアライブラリを執筆しております。

翻訳

英文版の原文と日本語訳版(本文)をご用意しております。読者の皆様による他の言語への翻訳版も歓迎いたします。全文翻訳で省略がなければ、採用を検討させていただきます。心より感謝申し上げます!