メトリクス相関機能で根本原因分析を加速 | Datadog

メトリクス相関機能で根本原因分析を加速

Author Lior Belenki

Published: 12月 20, 2019

実行されるアプリケーションが絶えず変化する現代。監視対象のメトリクスとイベントの数が急増し、システムコンポーネントに対する責任もチーム間で断片化しているため、問題の根本原因をタイムリーに特定することはますます困難になっています。 この課題に対処するために Datadog ではメトリクス相関機能を導入しました。システム内で相関関係のあるメトリクスを検索することで、考えられる問題の原因を自動的に検出します。

メトリクスに異常な変化があった場合は、メトリクス相関機能が対応する期間中に発生した他のメトリクスの不規則性を検索します。ダッシュボードを手作業で確認し、メトリクスをプロットして傾向を識別する必要はありません。Datadog からヒントが自動で提供されるため、より効率的に根本原因分析を行うことが可能となります。

質の高い調査は、まず優れたツール選びから

メトリクス相関機能は、ダッシュボード、モニター、ノートブックなどの複数のエントリーポイントから起動できます。 また、メトリクス内の異常な傾向を自動で検出するツール Watchdogからの起動も可能です。この相関機能と Watchdog を併用すれば、Datadog のシステム上で潜在的な問題検知と根本原因分析の双方が実施可能に。 メトリクスの不規則な変化に気づいたり、通知を受けたりするたびに、その原因調査を迅速に開始することができます。

metric-correlations1-v4.png

上の画像は、Watchdog がオンラインストア内のショッピングカートでクーポンを適用する顧客に対して、予期せぬレイテンシーの増加を検出した例です。このような場合に Watchdog のストーリー内からメトリクス相関機能を実行して、遅延の詳細を調査することが可能です。

問題を隅々まで理解する

メトリクス相関機能を利用すれば、問題の全範囲とそこから派生する影響を解明し、修復への道筋をすばやく見つけることができます。 たとえば、以下のダッシュボードの画像は、オンラインストアでチェックアウト数が減少した理由を探る場合の例です。

metric-correlations-start-v3.png

メトリクス相関機能はグラフから直接実行が可能です。次に挙げるような様々なソースから、何千にも及ぶメトリクスをスキャンすることができます。

メトリクス相関機能はソースごとに結果をグループ化し、システム内のどのコンポーネントが問題に関係しているかの洗い出しに貢献します。画面上の結果にカーソルを重ねると、それぞれの結果の詳細情報を確認できます。問題の原因となりうるソースを把握したら、最も可能性の高いものから結果を掘り下げてみていくと効果的です。

metric-correlations2-v5.png

上記の例では、「Checkout Funnel Tracking」のダッシュボードに異常な動作がみられます。該当するグループをクリックすると、関連する結果についての詳細が表示されます。

metric-correlations3-v4.png

この画面から、ショッピングカートからの離脱が同じタイミングで急増していることが分かります。ウェブサイトで「チェックアウト前に」費やした時間(チェックアウト待ちの状態)も同様です。

その他のソース(APM サービス、ダッシュボード、インテグレーションなど)で見つかった相関関係は、画面のサイドバーから簡単に確認できます。たとえば、「web-store-mongo」をクリックすると、カートに追加されたアイテムを MongoDB データストアからプルするサービスのメトリクスの相関関係が表示されます。

metric-correlations4-v4.png

この画面では、Web-store-mongo サービスのリクエストとレイテンシーのメトリクスのグラフ形状に相関関係があることが分かります。このデータから、チェックアウトの待ち時間が延びた背景、そして結果としてショッピングカートの離脱数が増えた理由が見えてきます。

集中的な原因調査をサポート

デフォルトの場合、メトリクス相関機能は選択したメトリクスの異常値に基づいて関心領域(検索される最も早い時刻と最新の時刻)を自動で定義します。関心領域はグラフ内でハンドルをドラッグすることで調整が可能です。

また、メトリクス相関をカスタマイズして、デフォルトのソースに加えてカスタムメトリクスを含めた検索を行うこともできます。システム全体を包括的にカバーしたい場合は特に有用です。特定の環境、サービス、インフラストラクチャーの一部を調査したい場合は、任意のタグを含むメトリクスで検索範囲を設定すると便利です。

相関関係を今すぐチェック

Datadog をすでにお使いの方は、メトリクス相関機能を今すぐご利用いただけます。問題のスコープの把握、考えられる根本原因の特定、迅速な調査の実施などに活用してください。新規のお客様は をお試しください。