自動インシデント管理 | Datadog
自動インシデント管理 image

自動インシデント管理

Datadog プラットフォームに統合された、エンドツーエンドのインシデント管理。コンテキストの切り替えや手動での処理を必要としません。

Olo では、レストランを回すために常にシステムの状況を把握する必要があります。すでに Datadog はそこで重要な役割を果たしていますが、 統合 Incident Management のリリースにより、チームはより迅速かつ効率的に対応できるようになりました。

Greg Shackles

Greg Shackles

Vice President, Technology at Olo

effx は、インシデントのコンテキストと要因をリアルタイムにユーザーに提供しています。Datadog の Incident Management との連携で、大量のマイクロサービスに影響を与える可能性のあるインシデントの管理に詳細な知見を提供できるようになりました。

Joey Parsons

Joey Parsons

Founder & CEO at effx

Datadog の Incident Management により、DevOps チームや SRE はインシデント対応ワークフローを最初から最後まで効果的に管理することができるため、無駄な時間やストレスを減らすことができます。ユーザーは、プラットフォーム全体のモニタリングデータを参照しながら、Datadog アプリで直接インシデントを自動的に検出、トリアージし、解決することができます。


トリガーされたアラートやセキュリティ信号からインシデントを作成し、調査して解決

  • Datadog と Slack アプリ(ベータ版)でインシデントの検知から解決まで管理。コンテキストの切り替えは不要
  • すでに使用しているツールとの自動インテグレーションを活用
  • 自動化されたすぐに使えるワークフローでインシデント管理プロセスを簡素化

協調的かつ動的に対応するチームを結成

  • タグ付け、ロール、リアルタイムコラボレーションで適切な人材やチームを瞬時に招集
  • 調査全般にわたり利害関係者と協力しながら、インシデントに特化したコミュニケーションストリームを利用
  • インシデントに関連する状況をすべて把握するインタラクティブなタイムラインで連携
協調的かつ動的に対応するチームを結成

スタック全体からの監視データを活用し、レスポンスを向上

  • ログ、トレース、ネットワーク、インフラストラクチャーなどを精査し、根本原因を突き止める
  • コンテキストを失うことなく、デスクトップや Datadog のモバイルアプリから問題や障害を確認
  • 関連するグラフやビジュアル、何らかのエビデンスをタイムラインに表示し、インシデントの間リアルタイムにモニタリング

Datadog Postmortem Notebooks でインシデントの作成から解決までのデータを保存

  • インシデントデータを使い事後分析を自動生成したり、指定したツールにデータをエクスポート
  • リアルタイムコラボレーションで、対応チーム全体の進捗を追跡
  • 任意のデータソースからのグラフを含め、影響を与えた時間きっかりにスコープする
Datadog Postmortem Notebooks でインシデントの作成から解決までのデータを保存