在本教程中,我們將逐步演示如何用 OpenResty XRay 定量地分析 Rust 的 Sled 庫中 CPU 時間的消耗情況。我們將展示其中佔用 CPU 最多的那些 Rust 程式碼路徑。這些熱程式碼路徑是 OpenResty XRay 自動分析和解讀 Rust 語言級別的 CPU 火焰圖得來的。

Problem: 高 CPU 使用率

Sled 是一個由 Rust 編寫的嵌入式 KV 資料庫。

Screenshot

我們有一個基於 Sled 的內部 cache 服務。

Screenshot

可以看到 CPU 的使用率非常高,超過 100%。

Screenshot

使用 OpenResty XRay 的引導式分析功能分析 Rust 的 Sled 庫中 CPU 時間的消耗情況

讓我們使用 OpenResty XRay 來檢查這個未經修改的程序。您可以對它進行實時分析,並找出原因。

Screenshot

確保我們當前分析的是正確的機器。

Screenshot

如果當前顯示的機器不對,您可以從下面的列表中選擇一個正確的。

Screenshot

進入 “Guided Analysis” 頁面。

Screenshot

這裡可以看到系統能分析的不同型別的問題。

Screenshot

讓我們選擇 “High CPU Usage”。

Screenshot

點選 “Next”。

Screenshot

選擇之前的 sled 應用,是 Rust 應用型別。

Screenshot

選擇消耗超過 100% CPU 資源的程序。也就是我們之前在 top 中看到的。

Screenshot

確保應用的型別是正確的。通常預設值就是對的。

Screenshot

這裡的語言級別就只有 “Rust” 了。

Screenshot

我們還可以設定最大分析時間。這裡保持預設的 300 秒不變。

Screenshot

開始分析。

Screenshot

系統將持續執行多輪分析。現在它正在執行第一輪分析。

Screenshot

第一輪分析已經完成,現在進入第二輪分析。對這個例子來說,執行一輪分析就夠了。

Screenshot

現在停止分析。

Screenshot

可以看到自動生成了一份分析報告。

Screenshot

這是現在我們要分析的問題型別,是CPU。

Screenshot

這個是佔用 CPU 時間最多的 Rust 程式碼路徑。

Screenshot

第一個函式 sled::tree::Tree::insert 在 Sled 中用於資料插入。

Screenshot

點選 “More” 檢視詳情。

Screenshot

上面的熱程式碼路徑是從這個 Rust 級別的 CPU 火焰圖中自動推匯出來的。

Screenshot

下面是對當前問題更詳細的解釋和建議。它提到了我們之前看到的 insert 函式。

Screenshot

點選這個圖示放大火焰圖。

Screenshot

點選 insert 函式檢視更多詳情。

Screenshot

在左側,可以看到 view_for_key 函式佔比較大。這是 Sled 庫中為給定 key 獲取快照檢視的函式。

Screenshot

在右側能看到,pagecache 是 Sled 的一個元件,用於按頁面管理資料。寫入的資料首先儲存在 pagecache 的記憶體頁面中。然後當批次寫滿時,透過重新整理磁碟來持久化。

Screenshot

點選放大。

Screenshot

這是在 Glibc 中的 realloc 函式,是一個記憶體分配函式。我們可以看到 libc 的記憶體分配函式比較熱。

Screenshot

在終端上,使用 find 命令在 cargo 快取中查詢 Sled 庫原始碼目錄。

Screenshot

複製找到的目錄,進入 Sled 原始碼目錄。

Screenshot

讓我們回到原始的熱程式碼路徑。將滑鼠懸停在 insert 函式的綠框上。在提示框中可以看到這個函式的原始檔名。

Screenshot

這行原始碼的行號是 164。

Screenshot

點選這個圖示,複製這個函式的原始檔路徑。

Screenshot

用 vim 編輯器開啟原始檔。貼上我們剛才複製的檔案路徑。您可以使用任何您喜歡的編輯器。

Screenshot

正如 OpenResty XRay 建議的那樣跳轉到第 164 行。

Screenshot

這行程式碼是在 insert 函式內的。

Screenshot

接下來檢視第二條程式碼路徑。第二佔用 CPU 時間的程式碼路徑,消耗了近 40% 的 CPU 時間。

Screenshot

頂層的函式呼叫 get_inner,是 Sled 庫內部用於獲取資料的介面。

Screenshot

get 函式是庫對外暴露的介面,它在內部呼叫了 get_inner 函式。

Screenshot

點選 “More” 檢視詳情。

Screenshot

放大火焰圖,檢視 get_inner 函式呼叫的詳情。

Screenshot

放大 get_inner

Screenshot

可以看到,get_inner 函式內的大部分 CPU 時間都是被前面提到的 view_for_key 函式佔用。

Screenshot

Rust 的 Sled 庫中用 sled::lru::Lru::accessed 函式,來更新 LRU 快取中專案的訪問狀態。並返回需要剔除的頁面 ID 列表。

Screenshot

全自動分析報告

OpenResty XRay 也可以自動監控線上程序,並顯示分析報告。

Screenshot

切換到 “Insights” 頁面。

Screenshot

您可以在 “Insights” 頁面中找到以日和周為週期的報告。其實您不是非得用 “Guided Analysis” 功能。

Screenshot

當然 “Guided Analysis” 對於應用的開發和演示是很有用的。

Screenshot

關於 OpenResty XRay

OpenResty XRay 是一個動態追蹤產品,它可以自動分析執行中的應用程式,以解決效能問題、行為問題和安全漏洞,並提供可行的建議。在底層實現上,OpenResty XRay 由我們的 Y 語言 驅動,可以在不同環境下支援多種不同的執行時,如 Stap+、eBPF+、GDB 和 ODB。

關於作者

章亦春是開源 OpenResty® 專案創始人兼 OpenResty Inc. 公司 CEO 和創始人。

章亦春(Github ID: agentzh),生於中國江蘇,現定居美國灣區。他是中國早期開源技術和文化的倡導者和領軍人物,曾供職於多家國際知名的高科技企業,如 Cloudflare、雅虎、阿里巴巴, 是 “邊緣計算“、”動態追蹤 “和 “機器程式設計 “的先驅,擁有超過 22 年的程式設計及 16 年的開源經驗。作為擁有超過 4000 萬全球域名使用者的開源專案的領導者。他基於其 OpenResty® 開源專案打造的高科技企業 OpenResty Inc. 位於美國矽谷中心。其主打的兩個產品 OpenResty XRay(利用動態追蹤技術的非侵入式的故障剖析和排除工具)和 OpenResty Edge(最適合微服務和分散式流量的全能型閘道器軟體),廣受全球眾多上市及大型企業青睞。在 OpenResty 以外,章亦春為多個開源專案貢獻了累計超過百萬行程式碼,其中包括,Linux 核心、Nginx、LuaJITGDBSystemTapLLVM、Perl 等,並編寫過 60 多個開源軟體庫。

關注我們

如果您喜歡本文,歡迎關注我們 OpenResty Inc. 公司的部落格網站 。也歡迎掃碼關注我們的微信公眾號:

我們的微信公眾號

翻譯

我們提供了英文版原文和中譯版(本文)。我們也歡迎讀者提供其他語言的翻譯版本,只要是全文翻譯不帶省略,我們都將會考慮採用,非常感謝!