Datadog での Azure 拡張モニタリング | Datadog

Datadog での Azure 拡張モニタリング

Author Steve Harrington

Published: May 27, 2020

Microsoft Azure はアプリケーションをグローバルスケールで構築、デプロイ、管理できるクラウドコンピューティングプラットフォームです。Azure なら多種多様な機能を備えた充実のサービス構成で、あらゆる種類のワークロードをサポートする大規模かつ高度なシステムを作成できます。しかし、コンフィギュレーションのオプションやリソースタイプの数が非常に多いことから、Azure 内で稼働するアプリケーションの健全性とパフォーマンスを理解するのは極めて困難です。

そこで今回、Datadog は Azure インテグレーションに新しいタグとメトリクスを追加し、Azure 環境をこれまでにない精度で可視化できる拡張版をリリース。Azure Monitor から収集するすべての標準メトリクスに加えて、Datadog でその他のリソース固有の Azure メタデータ API に自動でクエリを送信し、その情報を使用して追加の時系列メトリクスを生成できるようになりました。現在、既存のインテグレーションでは、Datadog が生成する 40 種類のメトリクスと Azure サービスで利用できる新しいタグを多数ご利用いただけます。対象のサービスは次の通りです。

  • App Service
  • Azure Functions
  • App Service プラン
  • Azure SQL Database
  • Azure Load Balancer
  • Azure Virtual Network
  • Usage and Quotas
  • リソース数およびステータス

また、便利な機能が詰まった新しいダッシュボードにも注目です。既存のダッシュボードも新しいデータを追加する形で刷新されました。追加のコンフィギュレーションなしで、Azure のエコシステム全体についての詳細かつよりアクションにつながりやすいインサイトを獲得することができます。

Azure App Service について

Azure App Service は、事前定義済みのコンピューティングリソースを用いて Web アプリケーションとサーバーレス関数のデプロイをサポートする強力な PaaS (Platform as a Service) プラットフォームです。しかし、お使いのアプリケーションや関数、下位のインフラストラクチャーの関わりを把握するとなると、概念的にも技術的にも難しい場合があるかもしれません。Datadog はこのような Web アプリ、関数、App Service プランなどさまざまな要素の関わりを簡単に把握できるよう、新しいメタデータタグの追加、およびプリセット済み Azure App Service ダッシュボードの刷新を行いました。

Datadog' の Azure App Service 拡張ダッシュボード

Web アプリと関数は現在、それらが稼働している App Service プラン名でタグ付けできるようになりました。これにより、アプリケーション、そして付帯するホスティング環境の健全性とパフォーマンスを簡単に可視化することができます。たとえば Web アプリで問題が発生した場合に、その問題が CPU 使用率に関係するものなのか、下位インフラストラクチャーにおけるその他のパフォーマンス低下に起因するのかといった有益な情報を得ることが可能となります。

時には、問題の修復が App Service プランのオートスケーリングのポリシーを調整する、または新規ティアにアップグレードするといった簡単な作業のみで完了する場合もあります。Datadog では App Service プランのメトリクスをティア (例: ベーシック、スタンダード、プレミアムなど) とタグ付けし、各プラン内の現在のホスト数と最大数を追跡する新しいメトリクスを提供しています。これにより、App Service プラン内のスケールを追跡し、リソースの制約に陥っていないかを簡単に確認することができます。これらの拡張機能を通じて App Service アプリ内における潜在的なリソースのボトルネックを特定し、すばやい是正措置を講じることが大切です。

Azure SQL Database 向け Geo レプリケーションリンクの状態を追跡する

既存の Azure SQL Database メトリクスに、データベースロール、プランの種類、最大サイズなどの重要情報の特定に役立つ新しいタグが加わりました。また、Geo レプリケーションリンクのステータスを可視化できないかという声もお客様から多くいただきました。Geo レプリケーションリンクはプライマリデータベースとそのバックアップを接続するものです。レプリケーションリンクが不健全な状態にあると、データ損失などのリスクに晒される恐れがあります。

以前は、データベースの Geo レプリケーションリンクの現状を閲覧するには Azure ポータルへの特別なアクセスが必要でした。Azure Monitor から関連するメトリクスが得られないため、履歴の閲覧や状態の監視を自動で行う方法が存在しなかったのです。今ではこれらのリンクに対するインテグレーションクエリが Azure SQL Database API から定期的に発信され、Datadog ダッシュボードやアラートの作成に便利な新しいメトリクスを生成できるようになりました。このメトリクスは新しくなった Azure SQL Database のプリセット済みダッシュボードでお試しいただけます。

Datadog の Azure SQL Database 拡張ダッシュボード

Azure Load Balancer

Datadog は Azure Monitor から、Azure Load Balancer のパフォーマンスと健全性についての有益な情報を格納したメトリクスを収集します。しかし、Azure Monitor が、受信リクエストに対応するバックエンドプールに存在する多数の VM に直接メトリクスを提供することはありません。これにより、ロードバランサーのパフォーマンス問題を調査する際の可視性の度合いに深刻な溝が生まれる恐れがあります。Datadog は Azure Load Balancer 向けに、ロードバランサーのバックエンドプール内のホスト数を計算する Datadog 由来のメトリクスを新規作成し、これを利用してバックエンド VM とトラフィックを転送するロードバランサーについての情報のスケーリングを行うことで、パフォーマンスとトラブルシューティングの効率を最適化することに成功しました。

このデータは新しいプリセット済みダッシュボードに表示され、メトリクスの可視化と理解をサポートします。

Datadog の Azure Load Balancer 拡張ダッシュボード

Azure のリソース制限と割り当て

多くの Azure サービスには制限と割り当て機能が搭載されています。詐欺や乱用を防ぐために Azure のポリシーに適用されるものもあります。たとえば、Azure はデフォルトで各サブスクリプションの vCPU コア数をリージョンごとに 20 までと制限しています。その他、仮想ネットワークの規模が CIDR ブロックにより制限されるといったシステム上の自然な制限も適用されます。

リソースの出所に関わらず、Azure 環境のリソース使用量を割り当ておよび制限と比較して追跡することはプロビジョニングの不具合を回避するために不可欠です。Datadog のインテグレーションでは、Azure Usage API からデータを収集し、Azure ストレージ、ネットワーク、およびスタック内のコンピューティングリソースの消費量と制限を追跡できるようになりました。これらの新しいメトリクスと関連するタグを利用して、簡単にアラートで通知を出すことができます。たとえば、ストレージアカウントやリージョン内のパブリック IP アドレス数が制限値に近づいている場合にアラートを送信するといった設定も可能です。このようなポリシーの制限は、新しい Azure Usage and Quotas プリセット済みダッシュボードで追跡できます。

Datadog の Azure Usage and Quotas 拡張ダッシュボード

また、新しい Azure Virtual Networks プリセット済みダッシュボードを使用して Azure Virtual Network アドレススペースの割り当てと可用性を追跡することもできます。これらの新しいメトリクスとダッシュボードを活用することで、リソース制限を超過して予期せずブロックされてしまうなどの事態を回避できます。

リソース数

Azure リソースのモニタリングについて、「リソース数はいくつあるか」「それぞれのリソースのステータスは何か」といった質問がよくみられます。しかし、これまでリソース数を直接追跡する標準メトリクスは存在せず、この値を可視化してアラートを作成することはできませんでした。

この問題を解決するために、Datadog では Azure の各リソースタイプに対応する新しいメトリクスを作成しました。これらのメトリクスは azure.*.count 形式のさまざまな Azure リソースタイプで利用可能です。たとえば、所有している VM の数は azure.vm.count の合計で求めることができます。ステータスを確認する場合は、同じメトリクスを status タグでグループ化します。

Datadog で Azure リソースの *.count メトリクスを生成

新しい .count メトリクスを使えば、Azure のリソースの追跡、可視化、ステータスの変更に応じたアラート送信を簡単に実行できます。Azure 環境の健全性と構成を直感的に表す視覚的なダッシュボードの構築にも有用です。

今すぐ始めよう

上記でご紹介した Azure インテグレーションの拡張機能は現在公開中です。Datadog を既にご利用のお客様はすぐに利用が可能です。詳細はドキュメントをご確認ください。まだ Datadog をご利用でない場合は、で Azure インフラストラクチャーのパフォーマンスと健全性に関する包括的なインサイトの取得をお試しください。