Datadog의 Metric Correlation 기능이 대단합니다!

3150 단어 Datadog

개요



Datadog의 진화는 빠르네요.
이번은, Metric Correlation 라고 하는 기능에 대해 소개입니다.

Metric Correlation 정보



AWS Dash 이나 여름의 Datadog 축제 Meetup에서도 소개되고 있었습니다만,
"[보고서] 여름 Datadog 축제 Meetup에 참가했습니다. "에 따르면

기계 학습을 활용하여 이상이 보이는 메트릭스와 같은 거동하고 있는 메트릭스를 찾아 온다(상관)

그리고 있습니다. 편리한 것처럼.

사용법



2019/9/26 시점에서는, 아직 Beta라고 하는 위치 지정입니다.

여기 의 Beta 요청 페이지에서 요청할 수 있습니다.

기능이 활성화되면 상관 관계를 조사하려는 그래프의 show this widget in full screen 버튼을 누르면,


탭 메뉴에 Correlation Beta가 추가됩니다.


사용해 보았습니다.



이번에는 aws.applicationelb.target_response_time.maximum라는 ALB 통합 메트릭을 예로 사용해 보겠습니다.

1. 시간대 선택



상관 관계를 조사한 그래프를 선택하면 조사하고 싶은 시간대를 선택합니다.


조사 대상의 시간대를 조정하고 싶은 경우는 Edit Search 버튼을 누르면 조정 가능합니다.

2. 조사 대상 선택



상관 관계를 조사할 데이터를 선택합니다.
옵션으로는
  • 통합 (AWS 및 GCP와 같은 각 서비스에 대한 통합 지정 가능)
  • 대시보드(이전에 만든 대시보드 지정 가능)
  • 사용자 지정 메트릭

  • 선택 가능합니다.

    예) 통합을 지정하려는 경우


    3. 검색 실행



    마지막은 Search 버튼을 누르기만 하면 됩니다.
    잠시 후 상관 관계가 있는 지표가 표시되므로 클릭해 봅니다.


    그러면 상관 관계가 있는 그래프의 세부 정보가 표시되었습니다.


    4. 원인 조사



    여기의 조사는 스스로 할 것입니다.
    이번 예라면

    • LA 상승
    • io wait 상승
    • 메모리 해제
    • 12시 그냥 시간대

    라는 사건으로부터 logrotate가 수상하다는 가설을 도출할 수 있었습니다.

    요약



    응답 시간이 튀는 1개의 사건만이라면, 여러가지 시점에서 조사하게 된다고 생각합니다만,
    Metric Correlation를 사용하면 상관 관계가있는 지표를 얻을 수 있으므로 문제를 해결할 때 도움이되지 않는다고 생각했습니다.
    이것이 버튼 1개로 가능하다고는, Datadog 무서운군요.
    앞으로의 진화에도 기대입니다.

    좋은 웹페이지 즐겨찾기