Datadog 개인 위치 자체 모니터링

7089 단어 Datadog
Datadog Synthetic의 Private Location 자체를 모니터링하는 방법에 대해 설명합니다.
무엇이 개인 위치입니까?이런 사람여기.
문제.
사적인 위치가 어떤 이유로 정지되면 테스트는 더 이상 실행되지 않지만 테스트 결과는 NG가 아니기 때문에 경보가 발령되지 않아 감시할 수 없다.
※ 2021/10/16 현재 Synthetic 감시는 양도 감시기처럼 데이터가 부족해 통지할 수 없습니다.
문제를 재현하다
  • 개인 위치만 선택하는 테스트를 만듭니다.
  • 개인 위치 직원을 정지한다.
  • 테스트 상태 OK, 실행 테스트 결과 정지.
  • 해결책
    상술한 문제는 개인의 위치 자체를 감시함으로써 해결할 수 있다.
    관련 양도
    2021/10/16시간문서에 아무런 기록이 없습니다. Datadog 사이트에서 메트릭 익스플로러를 통해 찾아보면 다음과 같은 Synthetics에 대한 도량을 확인할 수 있습니다.
    ※ 양도명칭에 첨부된 설명은 2021/08/26 Datadog 지원 응답 참조
  • synthetics.pl.livenessReturns 1 if the Private Location is up and running
  • synthetics.pl.worker.runningNumber of containers available to run tests for a Private Location
  • synthetics.pl.worker.outdatedIndicated if the Private Location image version is outdated, and can be upgraded
  • synthetics.pl.worker.pulled_testsNumber of tests pulled by a Private Location
  • synthetics.pl.worker.remaining_slotsAvailable slots to run pulled tests.
  • synthetics.pl.worker.concurrencyThe concurrency applied to each private locations
  • 의문
    사적인 위치를 감시하는 STATUS의 목적이라면 라이브니스의 양도는 일치한다고 생각했는데 실제 응용할 때 아래의 두 양도가 뭐가 다른지 몰라서 검증을 했습니다.
  • synthetics.pl.liveness
  • synthetics.pl.worker.running
  • 먼저 결과를 기재했다면 어떤 상태 전환이든 비슷한 행동을 보였다.
    전제 조건
  • 두 위치의 개인 위치를 만듭니다
  • 감시원으로 개인 위치를 만드는 APITEst
  • 아래 두 도량으로 총 6개의 모니터를 제작한다(시간 프레임 전체 5분)
  • synthetics.pl.liveness
  • synthetics.pl.worker.running
  • from locationid의 4개 단일 모니터
  • sum by locationid에 있는 다중 모니터 2개
  • 확인
  • 작업 용기 하나만 정지
    ● 단일 모니터의 어느 양도가 정지된 위치를경보상태로 옮긴다.
    A:다중 모니터의 정지위치의 양도가 NoData 상태로 옮겨져 경보상태가 되지 않았습니다.
  • 모든 모니터에 대한 검색default제로 함수 추가
    A:멀티모니터는 어느 양이든OK상태입니다.
  • 중지된 작업 컨테이너 재부팅
    □ 단일 모니터 경보가 복구되면 OK 상태가 됩니다.
    ●다중모니터는한순간경보상태로전환된후OK상태로전환된다.(다음 그림 참조)
  • 30분 정도 대기하고 OK 측정 차트를 안정시킨 후 다시 작업용기 1개 정지
    □단일 모니터가 경보상태로 전환됩니다.
    □다중 모니터의양을경보상태로 옮깁니다.하지만 15분 정도면 메트릭이 노데이터로 바뀌고 축에 따라 사라지기 때문에 경보 상태에서 OK 상태로 이동한다.
    (이 경우 경고 상태의 양도 임계값이 OK 상태로 마이그레이션되지 않으므로 복구 이벤트를 전송하지 않음)
  • 모든 작업 용기 중지
    □정지위치의단일 모니터가경보상태로바뀐다.
    □ 다중모니터는 어느 양도든 경보 상태로 15분가량 있다가 양도가 사라진 후 NoData 상태로 이동한다.
  • 감상
    synthetics.pl.liveness 메트릭은 기본적으로 질의 as-count 수식자가 첨부되어 있습니다.
    양도도표가 본 상위 0이나 1이 되지 않기 때문에 사적인 위치의 STATUS 판정에 사용할 수 없다.

    수식자asrate로 변경해도 사용할 수 없을 것 같아요.

    시간대를 5미터로 설정하면 예쁜 도표가 될 것이다.

    그러나 메트릭 모니터 조회에서는 5분간 타임프레임을 설정할 수 있지만, 모니터 상태·편집 화면에서는 최소 1시간 범위에서만 볼 수 있어 실제 판단한 값으로 판단할 수 없어 혼란스러울 수 있다.
    또한synthetics.pla.liveness 양도, 실제 개인 위치가 떨어지지 않아도 오프라인 상황이 발생할 수 있습니다.
    이것은 실제로 도표를 볼 때도 오해를 불러일으킬 수 있어서 나는 좋지 않다고 생각한다.

    대칭pl.worker.런닝 양도는 최소 1대도 작동하거나 작동하지 않은 것을 솔직하게 판단할 수 있기 때문에 사용하기 쉽다고 생각한다.
    지원도 물어봤어요.
    시간 등은 아직 정해지지 않았지만synthetics.pl.liveness, synthetics에 관하여pl.worker.런닝으로 대체할 수 있기 때문에 앞으로 디프리캣이 될 수 있기 때문에 추천하는 방법은 synthetics입니다.pl.worker.런닝이 되다.
    2021/09/07 데이터 지원 응답
    결론synthetics.pl.worker.running 양도로 모니터를 만듭니다.
    추기
    이 원고는 몇 달 전에 쓴 것으로 2021/11 정도에 Datadog 사이트와 문서가 모두 업데이트되었고 공식적으로 발표되었다문서.
    작업 컨테이너의 운행 상황, 개인 위치와 관련된 감시기 등을 확인할 수 있다.

    개인 위치를 만들면 다음 도량을 사용하는 세 개의 모니터가 자동으로 생성됩니다.(개인 위치가 작성된 기존 Organization에도 모니터가 생성됩니다.)
  • synthetics.pl.worker.running
  • synthetics.pl.worker.remaining_slots
  • synthetics.pl.worker.outdated

  • 본고도synthetics.pl.worker.running 도량을 사용하는 모니터를 처리하였으며, 조회는default-제로 함수가 없는 by locationid의 다중 모니터이기 때문에 작업 용기가 멈춰도 경보 상태로 전이되지 않고 NoData 상태가 됩니다. ※참조확인

    그러나 10분 동안 데이터가 분실되었을 때 알리는 옵션을 지정했기 때문에 경보 이벤트가 발표될 것입니다.


    이 조건에 문제가 없다면 특히 자체 모니터를 만들지 않아도 사적인 위치를 감시할 수 있어 좋다.
    참고 자료
    Synthetics 측정
    내장형 - Datadog Docs
    모니터 평가 중인 ascount() - Datadog Docs
    Monitor your private location - Datadog Docs
    Private Location Monitoring - Datadog Docs

    좋은 웹페이지 즐겨찾기