GCP CloudMonioring의 Uptime Checks 및 Datadog에서 가용성 시각화

운용하고 있는 서비스의 가용성을 쉽게 가시화할 수 없는 것이라고 생각하고 있었던 곳, GCP CloudMonitoring의 Uptime Checks와 Datadog로 간단하게 가시화할 수 있을 것 같았기 때문에 그 메모가 됩니다.

Uptime Checks



GCP의 CloudMonitoring 기능 중 하나로 HTTP(HTTPS) TCP 프로토콜에 대해 아래에서 지정한 수신처에 일정 시간마다 요청을 보내 상태를 확인해 줍니다. 거기에서 경고 알림도 가능합니다.
  • URL
  • GCP Instance
  • AWS Elastic Load Balancer
  • GCP App Engine

  • GCP뿐만 아니라 무엇이든 사용할 수있는 것이 기쁜 곳,,,
    HTTP 헤더도 추가할 수 있습니다.

    사용 요금은 무려 무료. (Basic Tier에 포함됨)
    h tps : // c ぉ d. 오, ぇ. 이 m/s타 ckd리ゔぇr/p리신g? hl = 그럼

    체크 원의 머신의 위치는 무려 6가지도 있어, 요한 레이턴시 시간도 표준 메트릭스로서 취득할 수 있습니다.
    (물론 체크 원의 머신은 GCP 측에서 관리되고 있습니다)



    공개되지 않은 서비스의 경우 확인할 컴퓨터의 IP 주소를 허용해야 합니다.
    그 리스트의 취득 방법은 아래의 문서를 참조. (UI나 API 경유로 취득할 수 있습니다.)

    Datadog



    GCP를 통합



    위의 Uptime Checks 메트릭은 Datadog 측에서 Google Platform을 통합하여 쉽게 얻을 수 있습니다.
    Integration 하면, 아래의 메트릭스를 취할 수 있게 되어 있다고 생각합니다.
  • gcp.monitoring.uptime_check.check_passed
  • gcp.monitoring.uptime_check.request_latency
  • gcp.monitoring.uptime_check.content_mismatch

  • 이번 이용하는 것은 맨 위의 check_passed입니다.

    지표에 대한 자세한 내용은 아래를 참조하십시오.
    htps : // c ぉ d. 오, ぇ. 코 m / 모니 토린 g / 아피 / 메 티 cs

    check_passed는 체크에 성공하면 BOOL형으로 True를 돌려준다는 것.
    그리고 성공하면 1, 실패하면 0을 돌려주는 것으로, 어느 기간의 메트릭스의 평균을 취하면 좋을 것.

    그래프 만들기



    모든 대시보드에서 Query Value를 드래그 앤 드롭합니다.
    그러면 그래프 작성 대화 상자가 열립니다.



    그러면 앞의 메트릭스를 바탕으로 설정 항목을 추가해 갑니다. (그림 참조)



    덧붙여서, 어느 값을 밑도면 빨간색으로, 웃도면 녹색으로 표시하도록도 할 수 있습니다.
    (SLA에서 이미 가용성 값을 결정한 경우 사용할 수 있습니까?)
    그림에서는 99.99를 목표로 99.985를 임계값으로 하고 있습니다. (반올림되기 때문에)



    여기까지 입력하면 Done 버튼을 눌러 저장하여 하나의 그래프를 완성합니다.
    이것을 사용하는 것으로 아래와 같은 Dashboard의 작성이 가능합니다.

    좋은 웹페이지 즐겨찾기