このチュートリアルでは、OpenResty XRay を使用して Rust の Sled ライブラリ内の CPU 時間消費を定量的に分析する方法を段階的に示します。CPU を最も消費している Rust コードパスを紹介します。これらのホットコードパスは、OpenResty XRay が Rust 言語レベルの CPU フレームグラフを自動的に分析し解釈した結果です。

問題:高 CPU 使用率

Sled は Rust で書かれた組み込み型 KV データベースです。

Screenshot

私たちは Sled ベースの内部 cache サービスを持っています。

Screenshot

CPU 使用率が非常に高く、100% を超えていることがわかります。

Screenshot

Rust の Sled ライブラリ内の CPU 時間消費を分析

OpenResty XRay を使用して、この未修正のプロセスを検査することができます。システムはリアルタイムで分析を行い、原因を特定します。

Screenshot

現在分析中のマシンが正しいことを確認してください。

Screenshot

正しくない場合は、リストから再選択することができます。

Screenshot

「Guided Analysis」ページに移動します。

Screenshot

ここでは、システムが分析可能な様々な種類の問題を確認できます。

Screenshot

「High CPU Usage」を選択します。

Screenshot

「Next」をクリックします。

Screenshot

先ほどの sled アプリケーション、つまり Rust アプリケーションを選択します。

Screenshot

100% の CPU を消費しているプロセスを選択します。これは先ほど top で確認したものです。

Screenshot

アプリケーションのタイプが正しいことを確認します。通常、デフォルト値が正しいです。

Screenshot

ここでの言語レベルは「Rust」のみです。

Screenshot

最長分析時間を設定することもできます。ここではデフォルトの 300 秒のままにします。

Screenshot

分析を開始します。

Screenshot

システムは複回数の分析を継続的に実行します。現在、初回の分析を実行中です。

Screenshot

初回の分析が完了し、現在 2 回目のラウンドに入っております。この例では、1 回の分析で十分です。

Screenshot

分析を停止します。

Screenshot

自動生成された分析レポートが表示されます。

Screenshot

これは分析対象の問題タイプである CPU です。

Screenshot

これは CPU 時間を最も消費している Rust コードパスです。

スクリーンショット

最初の関数 sled::tree::Tree::insert は Sled でデータを挿入するために使用されます。

スクリーンショット

「More」をクリックして詳細を表示します。

スクリーンショット

上記のホットコードパスは、この Rust レベルの CPU フレームグラフから自動的に導き出されたものです。

Screenshot

以下は、現在の問題についてのより詳細な説明と提案です。先ほど見た insert 関数について言及しています。

スクリーンショット

このアイコンをクリックしてフレームグラフを拡大します。

スクリーンショット

insert 関数をクリックして詳細を表示します。

Screenshot

左側では、view_for_key 関数が大きな割合を占めていることがわかります。これは Sled ライブラリ内で指定されたキーのスナップショットビューを取得する関数です。

Screenshot

右側では、pagecache が Sled のコンポーネントであり、ページ単位でデータを管理していることがわかります。書き込まれたデータは最初に pagecache のメモリページに保存されます。その後、バッチが満杯になると、ディスクにフラッシュして永続化されます。

Screenshot

クリックして拡大します。

スクリーンショット

これは Glibc の realloc 関数で、メモリ割り当て関数です。libc のメモリ割り当て関数がホットであることがわかります。

スクリーンショット

ターミナルで、find コマンドを使用して cargo キャッシュ内の Sled ライブラリのソースコードディレクトリを検索します。

Screenshot

見つかったディレクトリをコピーし、Sled のソースコードディレクトリに移動します。

スクリーンショット

元のホットコードパスに戻りましょう。insert 関数の緑色の枠にマウスを合わせます。ツールチップにこの関数のソースファイル名が表示されます。

Screenshot

このソースコードの行番号は 164 です。

スクリーンショット

このアイコンをクリックして、この関数のソースファイルパスをコピーします。

スクリーンショット

vim エディタでソースファイルを開きます。先ほどコピーしたファイルパスを貼り付けます。お好みのエディタを使用していただいて構いません。

スクリーンショット

OpenResty XRay が提案したように 164 行目にジャンプします。

Screenshot

このコード行は insert 関数内にあります。

スクリーンショット

次に、2 番目のコードパスを見てみましょう。2 番目に CPU 時間を消費しているコードパスで、CPU 時間の約 40% を消費しています。

スクリーンショット

トップレベルの関数呼び出し get_inner は、Sled ライブラリ内部でデータを取得するためのインターフェースです。

スクリーンショット

get 関数はライブラリが外部に公開しているインターフェースで、内部で get_inner 関数を呼び出しています。

Screenshot

「More」をクリックして詳細を表示します。

スクリーンショット

フレームグラフを拡大して、get_inner 関数呼び出しの詳細を確認します。

スクリーンショット

get_inner を拡大します。

スクリーンショット

get_inner 関数内の CPU 時間の大部分が、先ほど言及した view_for_key 関数に占有されていることがわかります。

スクリーンショット

Rust の Sled ライブラリでは、sled::lru::Lru::accessed 関数を使用して LRU キャッシュ内のアイテムのアクセス状態を更新し、削除が必要なページ ID のリストを返します。

Screenshot

自動生成レポート

OpenResty XRay はオンラインプロセスを自動的に監視し、分析レポートを生成することができます。「Insights」ページに切り替えてください。

Screenshot

「Insights」ページに切り替えます。

Screenshot

「Insights」ページでは、日次および週次のレポートを確認することができます。したがって、「Guided Analysis」機能を必ずしも使用する必要はありません。

Screenshot

もちろん、「Guided Analysis」はアプリケーションの開発やデモンストレーションに非常に有用です。

Screenshot

OpenResty XRay について

OpenResty XRay動的トレーシング製品であり、実行中のアプリケーションを自動的に分析して、パフォーマンスの問題、動作の問題、セキュリティの脆弱性を解決し、実行可能な提案を提供いたします。基盤となる実装において、OpenResty XRay は弊社の Y 言語によって駆動され、Stap+、eBPF+、GDB、ODB など、様々な環境下で複数の異なるランタイムをサポートしております。

著者について

章亦春(Zhang Yichun)は、オープンソースの OpenResty® プロジェクトの創始者であり、OpenResty Inc. の CEO および創業者です。

章亦春(GitHub ID: agentzh)は中国江蘇省生まれで、現在は米国ベイエリアに在住しております。彼は中国における初期のオープンソース技術と文化の提唱者およびリーダーの一人であり、Cloudflare、Yahoo!、Alibaba など、国際的に有名なハイテク企業に勤務した経験があります。「エッジコンピューティング」、「動的トレーシング」、「機械プログラミング」 の先駆者であり、22 年以上のプログラミング経験と 16 年以上のオープンソース経験を持っております。世界中で 4000 万以上のドメイン名を持つユーザーを抱えるオープンソースプロジェクトのリーダーとして、彼は OpenResty® オープンソースプロジェクトをベースに、米国シリコンバレーの中心部にハイテク企業 OpenResty Inc. を設立いたしました。同社の主力製品である OpenResty XRay動的トレーシング技術を利用した非侵襲的な障害分析および排除ツール)と OpenResty XRay(マイクロサービスおよび分散トラフィックに最適化された多機能ゲートウェイソフトウェア)は、世界中の多くの上場企業および大企業から高い評価を得ております。OpenResty 以外にも、章亦春は Linux カーネル、Nginx、LuaJITGDBSystemTapLLVM、Perl など、複数のオープンソースプロジェクトに累計 100 万行以上のコードを寄与し、60 以上のオープンソースソフトウェアライブラリを執筆しております。

翻訳

英語版の原文と日本語訳版(本文)をご用意しております。読者の皆様による他の言語への翻訳版も歓迎いたします。全文翻訳で省略がなければ、採用を検討させていただきます。心より感謝申し上げます!