このチュートリアルでは、OpenResty XRay が Rust アプリケーションを追跡する際のパフォーマンスへの実際の影響について説明します。OpenResty XRay がターゲットシステムのサンプリングと分析を行う際の CPU、メモリ、平均負荷、トラフィックスループット、リクエストレイテンシーなどを観察します。OpenResty XRay は、当社独自の動的トレース技術に基づく非侵襲型診断システムです。パフォーマンスオーバーヘッドが極めて小さく、実行中のアプリケーションをリアルタイムで分析し、様々な問題の根本原因を特定することができます。

アナライザー実行前のアプリケーションパフォーマンス

私たちには Rust で書かれたアプリケーションがあり、top コマンドを実行してプロセスリストを表示しています。現在、OpenResty XRay の Agent はアナライザーを全く実行していません。そのため、対象プロセスへのパフォーマンスへの影響は厳密にゼロです。これは動的トレース技術のおかげです。対象プロセスに対して一切の変更を加えることはありません。

Screenshot

rocket-server という名前のプロセスが見えます。これは Rust で書かれたアプリケーションです。

Screenshot

その CPU 使用率は約 73% です。

Screenshot

過去 1 分間の平均負荷値は 0.86 です。

Screenshot

CPU のアイドル率は 74.3% です。

Screenshot

現在利用可能なメモリは約 1566MB です。

Screenshot

OpenResty XRay を実行して、この Rust プロセスをアクティブに分析してみましょう。これにより、対象のパフォーマンスへの影響を確認することができます。

Screenshot

アナライザー実行中のパフォーマンスへの影響

ブラウザで OpenResty XRay の Web コンソールを開きます。

Screenshot

現在分析している対象マシンが正しいことを確認します。

Screenshot

プロダクションモードは、本番環境の分析に使用されます。このモードでは、対象アプリケーションとサーバーのパフォーマンスへの影響を最小限に抑えます。ただし、分析時間が長くなる可能性があります。

Screenshot

「Guided Analysis」ページに移動します。

Screenshot

「High CPU usage」を選択します。

Screenshot

「Next」をクリックします。

Screenshot

Rust アプリケーションを選択します。

Screenshot

CPU リソースの 74% を消費しているプロセスを選択します。これは以前 top で確認したものです。

Screenshot

分析を開始します。

Screenshot

システムは複数のラウンドで分析を継続します。

Screenshot

300 秒、つまり 5 分間のサンプリングを継続します。

Screenshot

先ほどのターミナルウィンドウに戻ってみましょう。CPU 使用率が現在約 74% であることが確認できます。これは 1% 未満の増加に留まっています。

Screenshot

過去 1 分間の平均負荷値は現在 0.92 となっており、以前の 0.86 から 0.06 増加しています。

Screenshot

CPU のアイドル率は 74.5% で、以前の 74.3% とほぼ変わりません。

Screenshot

現在の利用可能メモリは約 1564MB で、以前より約 2MB 減少しています。顕著な変化は見られません。

Screenshot

アナライザー実行時のスループットとレイテンシーへの実際の影響測定

サーバーの最大スループットを異なる条件下で測定しました。以下が調査結果です:

Screenshot

OpenResty XRay の Agent がインストールされていない場合、最大スループットは約 56,600 リクエスト/秒です。

Screenshot

Agent がインストールされているが、アナライザーが実行されていない場合、最大スループットは変わりません。

Screenshot

アナライザーがサンプリングを行っている場合、最大スループットは約 55,300 リクエスト/秒となり、サンプリングを行っていない場合と比べてわずか 2.2% の低下にとどまります。アナライザーの実行が対象プロセスの最大スループットに与える影響が非常に小さいことがわかります。

Screenshot

このパフォーマンステストは、サンプリング中のリクエスト遅延への影響を示しています。以下は、データを比較した結果の発見事項です。

Screenshot

OpenResty XRay の Agent がインストールされていない場合、平均リクエスト遅延は 37.79 マイクロ秒です。

Screenshot

Agent がインストールされているが、アナライザーが実行されていない場合、平均リクエスト遅延に変化はありません。

Screenshot

アナライザーが実行されている場合、リクエスト遅延は 38.91 マイクロ秒になります。わずか 1.12 マイクロ秒の増加にすぎません。これは、アナライザーの実行が対象プロセスのリクエスト遅延にも非常に小さな影響しか与えないことを証明しています。

Screenshot

「Insights」や「Dashboard」ページでの自動分析の処理負荷も非常に低く、先ほど確認したものと同様の水準となっています。

Screenshot

OpenResty XRay について

OpenResty XRay動的トレーシング製品であり、実行中のアプリケーションを自動的に分析して、パフォーマンスの問題、動作の問題、セキュリティの脆弱性を解決し、実行可能な提案を提供いたします。基盤となる実装において、OpenResty XRay は弊社の Y 言語によって駆動され、Stap+、eBPF+、GDB、ODB など、様々な環境下で複数の異なるランタイムをサポートしております。

著者について

章亦春(Zhang Yichun)は、オープンソースの OpenResty® プロジェクトの創始者であり、OpenResty Inc. の CEO および創業者です。

章亦春(GitHub ID: agentzh)は中国江蘇省生まれで、現在は米国ベイエリアに在住しております。彼は中国における初期のオープンソース技術と文化の提唱者およびリーダーの一人であり、Cloudflare、Yahoo!、Alibaba など、国際的に有名なハイテク企業に勤務した経験があります。「エッジコンピューティング」、「動的トレーシング」、「機械プログラミング」 の先駆者であり、22 年以上のプログラミング経験と 16 年以上のオープンソース経験を持っております。世界中で 4000 万以上のドメイン名を持つユーザーを抱えるオープンソースプロジェクトのリーダーとして、彼は OpenResty® オープンソースプロジェクトをベースに、米国シリコンバレーの中心部にハイテク企業 OpenResty Inc. を設立いたしました。同社の主力製品である OpenResty XRay動的トレーシング技術を利用した非侵襲的な障害分析および排除ツール)と OpenResty XRay(マイクロサービスおよび分散トラフィックに最適化された多機能ゲートウェイソフトウェア)は、世界中の多くの上場企業および大企業から高い評価を得ております。OpenResty 以外にも、章亦春は Linux カーネル、Nginx、LuaJITGDBSystemTapLLVM、Perl など、複数のオープンソースプロジェクトに累計 100 万行以上のコードを寄与し、60 以上のオープンソースソフトウェアライブラリを執筆しております。

翻訳

英文版の原文と日本語訳版(本文)をご用意しております。読者の皆様による他の言語への翻訳版も歓迎いたします。全文翻訳で省略がなければ、採用を検討させていただきます。心より感謝申し上げます!