Datadog 導入事例:SOMPO Light Vortex 株式会社 | Datadog
CASE STUDY

SOMPO Light Vortex 株式会社

AWSとGCPを利⽤するヘルスケアアプリ群の障害対応時間を7割削減し、セキュリティを強化へ

SOMPO Light Vortex 株式会社

SOMPO Light Vortex 株式会社は、損害保険ジャパン株式会社を中核とするSOMPOホールディングスが2021年7月に設立したデジタル事業子会社だ。最新デジタル技術を活用した商品やサービスの企画、開発、販売を行う。ヘルスケアを中心としたサービスを展開している。


主な成果

一元的にモニタリング

複数のプロダクトを、複数のクラウドに渡り一元的にモニタリングできる。

トラブルシューティングの時間短縮、非属人化

ログなどを一元的に監視できることでトラブルシューティングの時間を短縮し、熟練エンジニアでなくても判断できるようになった。

IaC化で生産性向上

監視のための準備作業をTerraformでコード化(IaC化)することで再利用性と生産性を高めることができた。

課題

複数のプロダクトを抱え、稼働するクラウドも異なるなか、横断的・統合的に管理する必要があった。


なぜDatadogなのか?

マルチプロダクト・マルチクラウドで統合的にモニタリングが可能。
IaC化の容易さ。
スモールスタートしやすさ。
セキュリティ機能にも注力していること。


保険の枠を超えてデジタルで新たな価値を

SOMPOホールディングスではデジタル戦略としてAIをはじめとする先端技術の研究開発や実証実験を重ね、デジタルの知見を蓄積してきた。2021年7月、保険の枠を超え、デジタルやソフトウェアを活用したサービス創出や新たな顧客価値の創造を目的として新設したのがSOMPOLight Vortex(以下、ライトボルテックス)だ。

ライトボルテックスが提供しているサービスには「Light PASS」や「WiTH Health」などがある。Light PASSは新型コロナワクチンの接種証明や新型コロナウィルスの陰性証明をデジ タル化し、接種者へのインセンティブとなる各種クーポンを一気通貫で 利用できる。WiTHHealthは接種記録や検診記録を一元管理し、その記録から疾病リスクの予測、生活習慣改善プログラムなどを提供するなど、データをもとに人と地域の健康を支援するトータルヘルスケアサービスだ。このほか企業向けにスマホの機能を活用して健康状態を観察するサービスなども提供している。

マルチプロダクト・マルチクラウドを統合的に監視

ライトボルテックスでは自社提供サービスのほかにSOMPOグループからの受託開発プロダクトも主管している。採用する技術要素は要件や関与するエンジニアたちが強みを発揮できることを考慮して選定するため、プロダクトごとに使用するクラウドが分かれてくる。当初はクラウドベンダーが提供するモニタリングツールを使用していたものの、それではプロダクトやクラウドを横断的・統合的にモニタリングできないことが課題となった。

今後、モニタリング対象のプロダクトが増えること、しかし、付随的な手間を含めたコストは最小限にしたい。スモールスタートでマルチプロダクトかつマルチクラウドを統合的に監視ができて、IaC化が容易で、エンジニア以外のメンバーと情報共有しやすい監視ツールが求められた。

「プロダクトごとにAWSやGCPとそれぞれの環境が異なるため、複数のプロダクトを複数のクラウドにわたり統合的に監視できるツールが必要でした。しかし、弊社は設立まもない企業で膨大なコストをかけることができません。検討を重ねた結果、スモールスタートに適していること、Terraformとの相性、エンジニア以外と情報共有しやすいこと、セキュリティ に力を入れていることなどからDatadogが選ばれました。」

SOMPO Light Vortex株式会社
藤野 智彦氏

障害調査時間を70〜80%短縮、IaC化で効率化

現時点では数個のプロダクトと同社のランディングページで、Datadogのログ、アラート、外形監視、ヘルスチェック、リアルユーザーモニタリング(RUM)、インシデント管理を利用している。

Datadog導入前はAmazon CloudWatchなどクラウドベンダーが提供する標準的な監視ツールを使っていたため、クラウドをまたいで監視できず、ロググループをまたぐ検索など機能面で制限が生じていた。またインシデント管理については、案件ごとにGoogleスプレッドシートで情報を管理していたため、管理が標準化されず、情報伝達も非効率的だった。Datadog導入後は複数のプロダクトやクラウドにわたり、一元的に監視できるようになった。

「当初ダッシュボードは標準のテンプレートそのままでしたが、プロダクトごとに見やすいものになるよう工夫を重ねてきました。エンジニアでない人でも情報を検索しやすくなったと自負しています。」

藤野 智彦氏

実際にインシデント発生時にはウェブサーバーのエラーを400番台エラー500番台エラーに分けて集計できて、問題の切り分けに大いに役立った。Datadogを使うことで障害調査時間は70%から80%短縮できた。

ライトボルテックスではDatadogとTerraformを組み合わせることで、環境設定の生産性向上を実現している。例えばアラート設定やSlackへの通知など監視の準備が通常なら3時間程度かかるところ、TerraformでIaC化することで再利用性を高め、作業時間を短縮している。さらにインシデント管理を使うことでインシデント情報の履歴を集約できて、これもインシデント対応の迅速化に貢献している。

ビジネスと開発が定量的な基準でコラボレーション

今後Datadogを通じて目指すこととして、藤野氏はSLOの運用と継続的な改善を挙げる。ユーザー増加が見込まれるなか、機能追加や品質改善を行う時に定量的に判断できるようにするためだ。ビジネスと開発のメンバーがSLOという共通言語で話せるようになる。

外形監視はまだエンドポイントの死活監視程度だが、今後はAPI連携で結合的APIテストなどを実施することでサイトの品質向上をはかる。さらにブラウザテストやセッションリプレイを活用することで、エンドツーエンド(E2E)テストの自動化に取り組み、ユーザー体験を可視化し、サービス改善につなげていく。Datadogのセキュリティ機能の活用にも意欲的だ。

「監視だけではなくセキュリティ機能(SIEM)も使うことで、運用全体をDatadogに寄せることができるのは大きい。これまで蓄積したDatadogの知見を活用でき、運用コスト を下げることにもつながると考えています」

藤野 智彦氏

リソース