事業拡大の中で7年にわたりDatadogを活用 運用工数を大きく増やすことなく効率的な監視を実施 | Datadog
CASE STUDY

事業拡大の中で7年にわたりDatadogを活用 運用工数を大きく増やすことなく効率的な監視を実施

about coconala inc.

2012年に設立し、個人の知識・スキル・経験などを売買できる「ココナラスキルマーケット」の提供を開始。現在、「ココナラスキルマーケット」の他、弁護士が探せる「ココナラ法律相談」、ITフリーランスと企業をつなぐ「ココナラテック」などを運営する。2024年1月にはみずほ銀行と共同で法人向けの人材マッチングプラットフォームを運営・開発する合弁会社「株式会社みずほココナラ」を設立した。

情報・通信

196名

東京都渋谷区

ミッションクリティカルに近いサービスである「ココナラスキルマーケット」において 、監視ツールは極めて高い信頼性が求められます。長きにわたり安定稼働を続けるDatadogの安心感は計り知れないものがあります。

case-studies/coconala_headshot
川崎 雄太 氏
株式会社ココナラ
システムプラットフォーム部
部長
Head of Information
case-studies/coconala_headshot

ミッションクリティカルに近いサービスである「ココナラスキルマーケット」において 、監視ツールは極めて高い信頼性が求められます。長きにわたり安定稼働を続けるDatadogの安心感は計り知れないものがあります。

川崎 雄太 氏
株式会社ココナラ
システムプラットフォーム部
部長
Head of Information
Why Datadog?
  • アラート設定の容易さ
  • ダッシュボードの視認性の高さ
  • データの保存期間の長さ
  • 各種インテグレーションの容易さ
  • 導入実績の多さ
Challenge
  • インフラの統合監視
  • サービスリクエストの日次モニタリング
  • 障害発生時の原因追究
  • インフラリソースのアラート&死活監視
Use case

Infrastructure Monitoring

Synthetic Monitoring

APM

SLO Dashboard

Real User Monitoring

Watchdog

Key Results
7年

初期導入から7年にわたりココナラの全サービスを監視

ダッシュボードやアラート管理の効率化

Datadogのテンプレート変数やタグによる設定機能を活用して複数リソースを共通設定

サービス監視に関する運用の効率化

サービスが増える中で運用工数を大きく増やすことなくインフラ監視を継続

SREの民主化

約70名のサービス開発・運用エンジニアがDatadogを活用

各サービスの監視を目的に
約70名の開発・運用エンジニアが活用

「一人ひとりが『自分のストーリー』を生きていく世の中をつくる」をビジョンに、「ココナラスキルマーケット」を運営するココナラ。会員登録数は2023年度末で約423万人、サービス出品数は79万件に達している。

同社がDatadogの利用を開始したのは2017年。サービスは当初からアマゾン ウェブ サービス(AWS)上に構築し、監視ツールとしてAmazon CloudWatchを利用していたが、効率的な監視運用には課題があった。そこで、インフラの統合監視の観点からDatadogを導入した。システムプラットフォーム部 部長Head of Informationの川崎雄太氏は「アラート設定の容易さ、ダッシュボードの視認性、データの保存期間の長さ、各種インテグレーション、機能の多さだけでなく、導入実績も豊富なことを評価して、当時の担当者が採用を決めました。ホスト型の課金体系やインシデント管理プラットフォームのPagerDutyとの連携のしやすさも評価が高かったようです」と語る

以来、7年にわたりDatadogを利用しているが、現在はココナラのサービス全般に適用し、開発・運用に携わる約70名のエンジニアが活用している。ユースケースは主に日次モニタリング、障害発生時の原因追究、サーバーリソースのアラート&死活監視の3点だ。

1点目の日次モニタリングは、インフラ・SREチームのメンバーが数人で担当。サービスへのリクエスト数を毎日チェックし、不自然なリクエスト増が見られた際には、障害や外部からの攻撃を疑いながら、原因追究に着手する。

2点目の障害発生時の原因追究は、Datadogの利用者全員が対象。別途利用しているWebサイト稼働監視/アプリケーション監視ツールなどで異常が発見された際、原因を探るために Datadogの各種メトリクスを確認する。システムプラットフォーム部 システムプラットフォームグループ インフラ・SREチームの上倉孝太氏は「リソースごとにダッシュボードを作成し、詳細に確認ができるようにしています。その中でデータベースが重い、検索エンジンの調子が悪いといった原因が判明した際はSlack等で開発・運用メンバーと共有して対処しています」と語る。

3点目のリソースのアラート&死活監視は、サービスの継続性に著しく関与するリソースに対してダッシュボードを作成し、しきい値を設けてアラートを発する設定としている。

写真左側:上倉 孝太 氏、右側:川崎 雄太 氏
写真左側:上倉 孝太 氏、右側:川崎 雄太 氏

テンプレート変数やタグにより複数リソースを共通設定
ダッシュボードやアラートの管理を効率化

ココナラでは、急増するサービスに効率的に対応するために、2023年秋頃からDatadogのテンプレート変数やタグによる設定機能を活用することで複数のリソースに共通設定ができるようにした。近年、ココナラは新規サービスが増加しており、「ココナラスキルマーケット」も新たな機能が短期間でリリースされている。インフラの数もそれらに比例して増えているが、監視やアラートの設定はサービス開発のメンバーが個別に対応している。その結果、チームごとに監視環境のバラツキが生じていた。

「そこで、タグを用いて新しいインフラにアラートを容易に設定することや、テンプレート変数を使って取得するメトリクスに漏れがないダッシュボードが作れるようにしました。その結果、開発チームの負荷を軽減しながら、統一基準に基づく監視を全サービスに適用できるようになりました」(上倉氏)

Datadogの導入から約7年。Datadogはココナラの各種サービスの信頼性向上と、ビジネスの成長に寄与している。

「業界トップクラスのユーザー数や出品数を抱える『ココナラスキルマーケット』は、ミッションクリティカルに近いサービスです。そのため監視ツールは極めて高い信頼性が求められます。長きにわたり安定稼働を続けるDatadogの安心感は計り知れないものがあります。また、サービスが増え続けていく中で、インフラ運用の効率化や管理工数の削減でも貢献をいただいています」(川崎氏)

Datadogを活用するうえで欠かせないことの1つが、Datadogからのサポートである。上倉氏は「Datadogは日本語のドキュメントが充実しています。各種資料やDatadogのブログを読むことで、メトリクスの見方や対処方法がすぐわかるのはとても助かります。また、問い合わせへの回答も迅速で、技術面では本社に英語で確認いただいたり、コスト面では日本の営業担当に相談に乗っていただいたりしています」と語る。川崎氏も「Datadogのユーザーコミュニティへの参加により、これまで知らなかった機能や他社の使い方を学ぶ機会が得られることや、Datadogのエバンジェリストと対話できる点でメリットを実感しています」と語る。

今後はさらなる活用に向けて、ダッシュボードの見直しやパフォーマンスの向上、費用対効果の最大化に取り組んでいく予定だ。

「今後は監視項目や取得するメトリクスを見直しながら、管理工数を削減していきます。また、システム信頼性の観点ばかりでなく、パフォーマンスを最大化する観点でも活用していきます」(上倉氏)

さらにココナラ独自のダッシュボードの使い方、ココナラならではのベストプラクティス運用に取り組み、他の監視ツール(Grafana、Prometheus、Amazon CloudWatch)との連携による全体最適化も進めていく計画だ。

「Datadogはオブザーバリティを高める手段としての活用を考えています。他社のベストプラクティスを調査しながら学べるものは学び、全体最適を意識して独自の使い方を模索していきます。また、SREの民主化に向けてバックエンドのエンジニアを中心に勉強会を重ね、アラートの結果から何が起きているか、それを深掘りできる技術力を高めていきます。Datadogには、引き続きユーザーコミュニティの活性化に向けた活動や、ココナラ向けの最適な使い方へのアドバイスを期待しています」(川崎氏)

Datadogは日本語のドキュメントが充実しています。各種資料やDatadogのブロ グを読むことで、メトリクスの見方や対処方法がすぐわかるのはとても助かります。

上倉 孝太 氏

株式会社ココナラ
システムプラットフォーム部
システムプラットフォームグループ
インフラ・ SREチーム

リソース