Datadog은 오늘 Dash 2021에서 코드, 데이터베이스, CI/CD 파이프라인 등의 상태와 성능에 대한 가시성을 한층 높여줄 수 있는 여러 신제품과 기능을 공개했습니다. 이제 코드 한 줄 수정 없이 네트워크 장치의 모니터링 및 서비스 관련 골든 시그널 메트릭에 대한 가시성 확보가 가능해졌으며, Datadog 앱을 통해 서드파티 툴을 Datadog의 플랫폼에 통합할 수 있게 되었습니다. Datadog은 또한 iOS Error Tracking, Session Replay 및 Watchdog Insights를 지원하도록 RUM을 강화했으며, 고객의 인프라 상에서 실행되면서 옵서버 빌리티 데이터의 처리 방법과 전송 위치 등을 제어할 수 있게 해주는 Datadog Observability Pipelines도 새롭게 추가했습니다. 이번 포스팅에서는 이렇게 새로워진 기능들과 Dash 2021에서 공개된 주요 제품 관련 소식을 요약하고, 이를 사용하여 조직이 운영하는 애플리케이션과 인프라, 프로세스의 가시성을 향상시키는 방법에 대해 알아보겠습니다.
인프라 및 네트워크 모니터링
Network Device Monitoring
수천 대의 서버, 라우터, 스위치 및 방화벽 등으로 구성된 온 프레미스/하이브리드 인프라를 유지 관리하는 능력은 때로 비즈니스의 성패를 좌우하는 요소가 되기도 합니다. 이러한 네트워크 구성요소 각각은 장애 시 전체 시스템에 영향을 미치므로, 장치 수준의 가시성을 확보하는 일은 효과적인 모니터링 전략에 있어 매우 중요합니다. Datadog Network Device Monitoring은 네트워크 팀이 Datadog 플랫폼 내의 인프라 전체를 쉽게 모니터링할 수 있도록 도와주는 장치 위주의 가시성을 제공합니다. Network Device Monitoring을 이용하면 네트워크 연결과 관련한 광범위한 문제를 한눈에 파악하고, 문제가 발생한 장치 내 영역을 구체적으로 식별하며, 개별 인터페이스를 통해 문제를 해결할 수 있게 됩니다.
Network Device Monitoring에 관한 별도의 블로그 포스팅에서 더 많은 정보를 확인하실 수 있습니다.
Universal Service Monitoring
끊임없이 변화해가는 애플리케이션 제품군을 보유한 조직의 경우, 배포된 모든 서비스의 상태와 성능을 SRE 담당자와 개발자가 일일이 추적하기 어려울 수 있습니다. Universal Service Monitoring을 이용하면 코드 한 줄 수정하지 않고도 조직의 모든 구성원이 백엔드 서비스 전체의 트래픽에 대한 가시성을 빠르고 안전하게 확보할 수 있게 됩니다. eBPF에 기반한 Datadog의 시스템 프로브는 커널에서 처리한 HTTP 메시지를 자동으로 구문 분석해 주므로, 사용자는 애플리케이션이 온라인 상태가 되는 즉시 요청률과 오류율, 대기 시간을 추적할 수 있습니다. 이러한 메트릭은 SLO를 달성하고, 알림을 설정하고, 서비스 맵으로 종속성을 시각화하고, 모든 서비스의 배포를 자동으로 추적하는 데 활용할 수 있습니다. Universal Service Monitoring은 현재 비공개 베타로 제공되고 있습니다. 액세스를 요청하려면 이 양식을 작성해주세요.
Universal Service Monitoring에 관한 별도의 블로그 포스팅에서 자세한 내용을 확인하세요.
애플리케이션 성능 관리(APM) 및 Continuous Profiler
Database Monitoring
Database Monitoring은 조직이 호스팅 하는 데이터베이스 전반의 상태와 성능에 대한 심층적인 가시성을 제공합니다. Datadog은 데이터베이스에서 직접 쿼리 성능 메트릭을 수집하고 시각화하여 가장 느리고 비용이 많이 드는 쿼리를 표시합니다. 문제가 있는 쿼리를 식별하고 나면, 설명 계획을 검토하여 해당 쿼리가 실행된 방식을 상세히 분석하고 병목 지점을 파악할 수 있습니다. 또한 쿼리를 호스트 메트릭과 자동으로 상호 연관시킴으로써 리소스의 제약이 데이터베이스 성능에 미치는 영향을 이해할 수 있게 해줍니다. 태그를 이용하여 개별 호스트나 데이터베이스 클러스터와 같은 플릿 내 특정 세그먼트에서 데이터를 격리할 수도 있습니다. 모든 쿼리 성능 메트릭은 3개월 동안 저장되므로, 장기 분석을 수행하고 SLO를 정의하며 알림을 설정하는 등의 작업이 가능합니다.
Database Monitoring은 현재 PostgreSQL, MySQL 및 SQL Server(베타)의 자체 호스팅 버전과 클라우드 관리형 버전을 지원합니다. 관련 블로그 포스팅에서 자세한 내용을 확인하세요.
파셋을 이용한 서비스 검색 및 필터링
Datadog의 APM 서비스 목록은 계측된 서비스 전체에 대한 주요 성능 메트릭을 한눈에 확인할 수 있도록 해줍니다. 이제 태그와 파셋을 이용하여 서비스를 필터링하고 검색할 수 있으며, 이로써 필요한 특정 서비스로 보기 범위를 지정하기가 훨씬 간편해졌습니다. 파셋을 이용하면 서비스를 유형별(예: 캐시, 데이터베이스, 웹 서비스)로, 그리고 Watchdog이 서비스 내의 잠재적 문제를 감지했는지를 기준으로 빠르게 필터링할 수 있습니다. 이렇게 하면 조사가 가장 필요하다고 판단하는 서비스로 즉시 드릴다운할 수 있게 되므로 문제 해결 속도가 빨라집니다.
확장된 프로파일러 지원
Continuous Profiler는 조직의 프로덕션 환경 전반에서 코드 수준 성능의 스냅샷을 제공합니다. 프로파일은 리소스 병목 현상을 식별하여 애플리케이션 성능을 개선할 수 있도록 실행 가능한 인사이트를 제공해 줍니다. Datadog은 올해 초에 코드 변경에 따른 장기적인 성능 관련 영향을 보여줌으로써 서비스 최적화를 도와주는 프로필 비교 보기를 소개해 드린 바 있습니다. Datadog은 Ruby 용 공개 베타 버전의 Continuous Profiler를 공개하게 되어 기쁘게 생각하며, PHP, .NET, C 및 C++도 곧 지원될 예정입니다.
실제 사용자 모니터링(RUM)
Session Replay
Session Replay는 개별 사용자 세션을 마치 비디오처럼 녹화함으로써 프런트엔드 오류의 해결에 있어 어림짐작을 배제하고, 해결 시간을 단축하며, 사용자 행동에 대한 중요한 인사이트를 제공해 줍니다. 기록된 세션은 단계별 이벤트 타임라인과 함께 표시되므로, 오류를 트리거 한 사용자 작업을 정확히 찾아내고 상황에 맞는 세부 정보로 전환하여 추가 조사를 수행하는 과정이 원활하게 진행됩니다. Session Replay는 또한 애플리케이션을 탐색하고 오작동 요소에 반응하는 사용자 패턴을 파악할 수 있도록 도와주며, UX 디자이너는 이를 통해 가설을 검증하고 개선이 필요한 영역을 식별할 수 있습니다. 기록된 세션은 신용카드 번호나 비밀번호와 같은 민감 데이터를 감추도록 기본 설정되어 있으므로, 고객 데이터의 보호에 관해 걱정할 필요가 없습니다.
Session Replay를 다루는 별도의 블로그 포스팅에서 자세한 내용을 확인하세요.
Funnel Analysis
Datadog Funnel Analysis는 Datadog RUM 데이터를 활용하여 비즈니스 건전성을 좌우하는 핵심 워크플로우를 사용자가 성공적으로 완료하고 있는지 쉽게 파악할 수 있는 시각화를 제공합니다. 특정 워크플로우를 구성하는 일련의 페이지뷰 및 작업을 선택하면, Funnel Analysis가 각 단계에서 다음 단계로 성공적으로 이동한 사용자 세션의 비율과 트래픽 이탈이 일어난 지점을 그래프로 표시해 줍니다. 이를 통해 사용자가 해당 플로우를 완료하기 전에 이탈하게 된 마찰의 원인을 빠르게 식별할 수 있습니다. Funnel Analysis는 각 단계를 자세히 분석하여 주요 전환율 메트릭을 표시하고 관련 Session Replay를 제시하여 사용자와 UI 간의 상호작용 방식을 더 잘 이해할 수 있게 함으로써 이러한 마찰의 잠재적 원인 파악을 도와줍니다. Funnel Analysis를 다룬 블로그 포스팅에서 자세한 내용을 확인하세요.
RUM용 Watchdog Insights
웹 및 모바일 애플리케이션과 관련한 문제 해결 시에는 사용자 장치, 운영체제, 백엔드 서비스 및 기타 요소의 불특정 조합이 문제의 원인일 수 있기 때문에 조사 방향을 결정하기가 어려울 때가 많습니다. Watchdog Insights는 Trace Search 및 Analytics, Log Explorer, 최근에는 RUM Explorer에서의 문제 해결 작업을 강화하기 위해 머신 러닝을 활용합니다. 데이터 조사가 수행되는 동안 Watchdog Insights는 현재의 검색어를 기반으로 가장 먼저 집중해야 할 태그들을 제안합니다. RUM Explorer를 예로 들면, Watchdog Insights는 비정상적인 비율의 RUM 오류 및 로딩 성능이 떨어지는 보기 내에 존재하는 태그를 강조 표시함으로써 배포 오류, 지역별 UX 문제 및 기타 애플리케이션 관련 문제를 신속하게 파악하도록 도와줍니다. RUM 용 Watchdog Insights는 공개 베타 버전으로 제공됩니다. 자세한 사항은 관련 문서를 참조하세요.
RUM Impact Analysis
Watchdog은 기준을 벗어난 메트릭을 자동으로 강조 표시함으로써 조직의 인프라 및 애플리케이션과 관련한 문제의 식별을 도와줍니다. Datadog은 올해 초에 특정 문제와 관련된 서비스 간의 관계를 자동으로 감지하여 근본 원인 분석의 속도를 높여주는 Watchdog RCA의 비공개 베타를 출시했습니다(액세스 요청은 이 양식으로). RUM Impact Analysis(현재 공개 베타 버전)는 우선순위 지정과 작업 분류를 돕기 위해 Watchdog 알림이 사용자에게 미치는 영향에 대해 빠르게 인사이트를 제공합니다. Watchdog이 새로운 APM 관련 경고를 식별하면, RUM Impact Analysis는 실제 사용자 모니터링(RUM) 데이터를 분석하여 잠재적으로 영향을 받은 사용자가 있는지, 먼저 조사해야 할 애플리케이션의 보기가 무엇인지 알려줍니다.
iOS Error Tracking
Datadog RUM의 iOS SDK를 통해 iOS 앱의 충돌 보고서를 Datadog으로 전달하여 장기 저장 및 분석을 수행하는 것이 가능해졌습니다. Datadog RUM을 사용하면 충돌 이벤트를 사용자 메타데이터 및 세션 세부 정보와 상호 연관시킬 수 있습니다. 이를 통해 버그의 심각도를 분류하고 사용자들이 버그를 재생산하는 경로를 정확히 확인할 수 있으므로 근본 원인의 분석이 효율적으로 이루어집니다. Datadog Error Tracking은 iOS 충돌 이슈를 자동으로 정렬하며, 여기서 고객 위치, iOS 버전 및 충돌 보고서에 포함시킨 모든 사용자 정의 속성과 같은 메타데이터를 비롯한 주요 디버깅 정보(예: 스택 추적 및 사용자 세션 타임라인)를 확인할 수 있습니다. Error Tracking 이벤트에 대한 알림을 설정하여 치명적인 문제 발생 시 적절히 대응할 수 있습니다. Datadog을 통해 iOS 앱의 충돌을 지속적으로 추적, 분류 및 디버그 함으로써 사용자에 대한 영향을 보다 효과적으로 관리하고 이탈을 줄일 수 있게 됩니다. 별도의 블로그 포스팅에서 자세한 내용을 확인하세요.
가상 모니터링
Private Location Monitoring
Datadog 가상 사설 위치를 사용하면 네트워크 내부로부터 테스트를 시작할 수 있게 되므로 테스트 가능 범위가 중요한 모든 내부의 애플리케이션으로 확장됩니다. 사설 위치는 테스트 인프라의 핵심적인 부분이므로, 온 프레미스 애플리케이션 테스트를 차질 없이 지원할 수 있도록 해당 성능에 대한 완전한 가시성을 확보하는 것이 중요합니다. Private Location Monitoring을 통해 모든 사설 위치 컨테이너의 상태와 성능을 모니터링하는 것이 가능해졌습니다. Datadog은 컨테이너 상태의 파악을 돕기 위해 실행 중인 작업자 수와 같은 주요 메트릭을 제공합니다. 또한 사설 위치에 프로비저닝이 부족한 경우와 같은 성능 관련 문제를 자동으로 알려주는 즉시 사용 가능한 모니터가 포함되어 있으므로 SRE 팀은 중요한 테스트 워크플로우를 지원하기 위한 최선의 확장 옵션을 판단할 수 있습니다. 자세한 내용은 관련 문서를 참조하세요.
UDP 및 WebSocket 테스트
UDP 및 WebSocket 프로토콜은 비디오 스트리밍 플랫폼이나 채팅 시스템, 온라인 멀티플레이어 게임 같은 실시간 애플리케이션에 널리 사용됩니다. 따라서 최종 사용자에게 대기 시간이 짧은 동적인 경험을 제공하기 위해서 애플리케이션을 모니터링하는 것이 중요합니다. Datadog은 즉각적인 데이터 교환에 의존하는 애플리케이션의 가용성과 응답성을 모니터링할 수 있는 UDP 및 WebSocket 테스트를 포함시킴으로써 Synthetic API 테스트 제품군을 확대했습니다. 문제에 대한 알림이 수신되면 Datadog의 모니터링 데이터로 즉시 문제를 해결하여 가동 중지 시간을 최소화할 수 있습니다.
로그 관리
Online Archives
인덱싱된 로그는 대부분의 DevOps 사용 사례에 필수적인 만큼 초 단위의 쿼리 응답을 제공하지만, 매우 큰 데이터 세트의 경우에는 속도보다 포괄성을 우선한다는 조사들이 많이 있습니다. 전체 로그 데이터를 장기간 동안 저장하고 쿼리를 처리할 수 있는 효율적인 비용을 제공하는 타 서비스는 없습니다. Datadog의 Online Archives는 조직의 모든 로그를 클라우드 규모의 볼륨에서 쿼리 가능한 상태로 15개월 이상 유지하는 새로운 로그 웨어 하우징 솔루션을 인덱싱 유지 비용보다 훨씬 저렴하게 제공합니다. 로그 데이터에 간편하게 액세스하여 과거 보안 조사, 정기적인 규정 준수 감사, 사후 분석 또는 높은 카디널리티 분석을 수행할 수 있게 됩니다. Online Archives는 현재 제한적으로 제공됩니다. 자세한 정보는 블로그 포스팅을 참조하세요.
Sensitive Data Scanner
분산 애플리케이션에서의 데이터는 느슨하게 연결된 여러 엔드 포인트와 마이크로 서비스를 넘나들며 이동할 수 있으므로 특정 서비스가 의도하지 않게 민감한 데이터를 로깅할 때 이를 알아채기가 어렵습니다. 이러한 경우는 중요한 규정 준수 정책의 위반일 뿐만 아니라 고객의 개인 정보가 노출될 위험까지 따라옵니다. Sensitive Data Scanner는 기밀 정보를 로깅 하는 서비스의 감지를 지원하므로 데이터 침해가 발생하기 전에 문제를 해결할 수 있게 됩니다. 스캐너는 들어오는 로그를 모니터링하여 주민등록번호, 신용카드 정보 등의 민감 데이터가 포함된 로그를 모두 표시합니다. 또한 고객 정보를 보호하고 규정 준수를 보장하기 위해 해당 데이터를 자동으로 난독화하도록 스캐너를 구성하는 것도 가능합니다. 자세한 사항은 관련 문서를 확인하세요.
Log Pattern Anomalies
로그 데이터 검색은 침해 사고 대응 시 유용하지만, 특히 사용자가 해당 애플리케이션과 로깅 메커니즘에 익숙하지 않은 경우에는 시간이 오래 걸리게 됩니다. Datadog의 Log Pattern Anomalies 기능은 문제의 근본 원인을 설명할 수 있는 새로운 로그 패턴 또는 기존 패턴에서 눈에 띄는 부위를 강조 표시함으로써 사용자의 노이즈 제거 작업을 도와줍니다. 예를 들어 특정 서비스 관련 오류의 증가에 대한 알림을 수신한 경우, Log Pattern Anomalies를 통해 그 이유(예: 아래와 같은 특정 서비스에 대한 TCP 연결 실패)를 파악한 다음 문제 해결을 위한 조치를 취할 수 있습니다. Log Pattern Anomalies는 현재 비공개 베타 버전이며, 로그 및 APM 데이터를 지속적으로 분석하여 조사 업무를 보강하는 추천 엔진인 Watchdog Insights에 최근 추가된 기능입니다. 베타 액세스 요청은 여기에서 가능합니다.
에코시스템
Observability Pipelines
Datadog의 온 프레미스 Observability Pipelines를 이용하면 옵저버빌리티 데이터의 처리 방법과 전송 위치 등을 완벽하게 제어할 수 있습니다. Datadog의 파이프라인은 로컬 하드웨어든 클라우드든 가리지 않고 고객의 인프라 상에서 실행되므로, 데이터가 시스템을 벗어나기 이전 단계에서 데이터 관련 결정을 내리는 것이 가능합니다. Observability Pipelines는 안전하고 비용 효율적인 방식으로 다양한 데이터 변환(예: 샘플링, 축소, 암호화, 강화)을 수행하여 데이터를 분석에 투입 가능한 상태로 바꾸어줍니다. 데이터 수집 및 처리가 이루어지고 나면 해당 용도에 가장 적합한 툴로 데이터를 라우팅할 수 있게 됩니다. 액세스를 요청하려면 이 양식을 작성해 주세요.
Datadog 앱
Datadog 앱 을 이용하면 다른 주요 서비스의 데이터와 기능을 Datadog 플랫폼에 직접 임베드할 수 있습니다. Datadog Developer Platform은 사용자 지정 위젯, 사이드 패널, 모달 및 기타 구성요소를 구축한 다음 대시보드에 추가함으로써 모니터링 및 애플리케이션 관리 워크플로를 통합할 수 있게 해줍니다. 현재 Datadog 앱 제품군에는 당사의 파트너인 LaunchDarkly, PagerDuty, Fairwinds, Harness, Rookout, Shoreline에서 개발한 위젯들이 포함되어 있으며, 앞으로 더 많이 제공될 예정입니다.
개발자 경험
CI Visibility
Datadog은 CI/CD 워크플로우의 상태와 성능에 대한 심층적인 인사이트를 제공하는 Datadog CI Visibility의 GA(일반 공급) 릴리스를 새롭게 발표하게 되어 기쁘게 생각합니다. CI Visibility는 GitLab, Jenkins, CircleCI, GitHub Actions, Buildkite 같은 주요 서비스를 지원하며, 이를 통해 어떤 파이프라인의 오류가 자주 발생하는지, 또는 빌드 하는 데 너무 오래 걸려서 개발 중단으로 이어지는지를 추적할 수 있습니다. CI Visibility는 또한 각각의 테스트에 대한 분산형 추적을 제공함으로써 불안정한 테스트를 자동으로 표시해 주는 한편, 테스트 오류를 디버그하고 테스트 제품군의 효율성을 장기적으로 추적하는 데 도움이 되는 핵심 인사이트를 제공합니다. 알림을 이용하여 파이프라인과 관련한 문제 발생 시 팀에 자동으로 알리는 것도 가능해졌습니다. CI Visibility를 다루는 블로그 포스팅에서 자세히 알아보십시오.
모바일 대시보드 위젯
성공적인 대기 근무를 위해서는 서비스 상태 모니터링 업무와 개인 생활 사이에 균형이 유지되어야 합니다. 하지만 노트북 컴퓨터를 항상 휴대할 수는 없기 때문에 식사를 하거나 기차를 타거나 운동을 할 때도 휴대폰을 이용해 시스템 활동을 빠르게 파악하는 것이 중요합니다. 그래서 Datadog은 대기 근무 모바일 대시보드 구축에 사용 가능한 모바일 위젯을 발표하였습니다. 모바일 대시보드는 Datadog 모니터, 침해 사고 및 SLO 관련 현황을 휴대폰의 홈 화면에서 한눈에 볼 수 있게 해줍니다. 문제 해결 및 사고 대응 시 가장 필요한 앱만을 포함하도록 모바일 대시보드를 사용자 정의하고 이를 휴대폰의 집중 모드와 함께 사용하면 대기 근무의 우선순위에만 집중할 수 있습니다.
모바일 대시보드는 대기 근무 환경을 단순화해주므로 노트북은 물론 Datadog 모바일 앱조차 열지 않고도 조사, 통신 및 협업을 수행할 수 있게 됩니다. 관련 블로그 포스팅에서 자세한 내용을 확인하세요.
GitHub 리포지토리와의 통합
Datadog은 개발자가 관련 소스 코드에 대한 인라인 가시성을 확보하고 리포지토리의 해당 위치로 직접 피벗 하여 문제를 추가 조사할 수 있도록 GitHub 리포지토리를 Datadog APM, Log Management, Error Tracking 등과 통합하는 새로운 GitHub 앱을 출시하게 되어 기쁘게 생각합니다. 예를 들어 Error Tracking의 스택 추적은 이제 해당 오류를 발생시킨 메서드에서 발췌한 내용으로 보강되므로, Datadog 환경을 벗어나지 않고도 근본 원인을 조기에 파악하는 것이 가능해졌습니다. Notebook의 풀 요청에 대한 링크도 미리 보기로 강화되므로, PR에 대한 주요 정보를 모든 Notebook에서 직접 확인할 수 있게 되었습니다. 또한 Datadog의 새로운 GitHub 앱은 Datadog CI Visibility를 사용한 GitHub 작업의 모니터링을 지원하므로 GitHub 리포지토리 전반에서 파이프라인, 단계 및 작업에 대한 주요 상태 및 성능 메트릭을 얻을 수 있습니다.
Cloud Cost Management
클라우드 서비스 도입이 확대되면서 조직은 고객이 요구사항에 신속한 혁신이 가능해졌습니다. 그러나 조직이 클라우드로 마이그레이션하고 더 많은 서비스를 채택할수록 클라우드 비용을 관리하는 일 역시 점점 더 어려워집니다. 특히 동일한 컴퓨팅 리소스(예: 컨테이너)를 여러 부서가 공유하고 있는 경우 재무팀은 개별 팀 및 제품과 관련한 비용을 적절하게 파악할 수 없게 됩니다. 또한 비용 상승이 효율성 감소 때문인지 아니면 사용량 증가의 결과인지 판단하기가 어렵습니다. 반면에 엔지니어는 정기적으로 애플리케이션을 변경하며 그 재정적 영향에 대해서는 모르는 상태입니다. Datadog Cloud Cost Management는 클라우드 비용과 운영 데이터를 한눈에 볼 수 있게 가져오는 단일 보기를 제공하여 이 문제를 해결합니다. 비용 관리자는 이 새로운 릴리스를 통해 클라우드 비용의 동향을 쉽게 파악하고 조직 전체에 지출을 할당하는 한편 비용 최적화 기회를 식별할 수도 있게 됩니다. 여기에서 베타서비스에 등록하세요.
Serverless
Serverless 보기에서 Azure App Service 탐색
Azure App Service 용 Datadog 확장은 웹앱과 관련한 분산 추적 및 사용자 지정 메트릭을 자동으로 수집해주며, Azure Portal을 통한 직접 배포 및 관리가 가능합니다. App Service에 더 많은 가시성을 제공하기 위해 Datadog의 Serverless 보기는 이제 모든 앱 서비스 리소스의 시각화와 리소스 간의 관계 매핑을 지원합니다. 앱과 호스팅 계획 간의 관계를 이해하는 것은 문제 해결, 보안, 성능 최적화 및 비용 관리에 있어서 중요한 요소입니다. Serverless 보기를 이용하면 확인하고자 하는 리소스로 쉽게 필터링하고 관련 메트릭, 로그, 추적 및 메타데이터를 한눈에 파악할 수 있게 됩니다. 블로그 포스팅을 읽어보고 Serverless 보기가 리소스의 주요 메트릭 분석 업무와 과부하 또는 미활용 플랜의 식별 작업 등을 어떻게 도와주는지 알아보십시오.
서비스 수준 목표(SLO)
SLO Alerts
SLO는 제공 중인 서비스의 안정성 관리를 도와줍니다. SLO Alerts는 이제 특정 서비스가 목표를 달성하지 못할 경우 이를 사전에 알려줍니다. SLO Alerts는 팀 작업의 우선순위를 지정하는 데 사용 가능한 두 가지 유형의 정보, 즉 오류 예산 알림과 소진율 알림을 제공합니다.
오류 예산 알림은 특정 서비스가 해당 SLO의 가용한 예산에서 지정된 비율만큼을 소비한 시점을 감지합니다. 제품 소유자는 이 정보를 사용하여 기능 개발보다 안정성 작업을 우선시함으로써 침해를 방지해야 할 경우를 판단할 수 있습니다. 소진율 알림은 특정 서비스가 오류 예산을 너무 빨리 소모하는 경우 자동으로 팀을 호출해 주므로 문제 해결을 위한 즉각적인 조치를 취할 수 있게 됩니다.
SLO 오류 예산 알림 및 소진율 알림은 현재 공개 베타 버전으로 제공됩니다. 자세한 내용은 관련 문서를 확인하세요.
규모 확장과 속도 향상
Dash 2021은 최신 소프트웨어 개발 분야의 전문가와 실무자가 한 자리에 모여 다양하고 안전하며 안정적인 프로세스와 팀을 구축하고 확장하는 방법과 관련한 지식을 공유하기 위해 마련된 행사입니다. HashiCorp, Vacasa, Shopify 등에서 참석한 발표자들의 발언을 비롯하여 Dash 2021 세션의 모든 비디오를 시청하실 수 있는 Dash 2021 콘퍼런스 리뷰도 예정되어 있습니다. Datadog을 아직 사용해 보지 않으셨다면 14일 무료 평가판으로 오늘 시작해 보십시오.