[AWS] CloudWatch가 뭐예요?이름 공간과 도량 등 전문 용어의 해설과 도표 제작까지.

5185 단어 AWS
개인 필기.

쿨론 위치의 용도


AWS가 사용하는 서비스 상태를 모니터링할 수 있는 시스템
임계값을 설정한 경우 경고 알림을 사용할 수도 있습니다.
표시된 데이터는 접선과 케이크 그림 등 좋아하는 형식을 선택할 수 있다.
▼ CloudWatch 대시보드 화면의 예

상술한 도표나 수치 등 좋아하는 작은 위젯을 좋아하는 곳에 표시할 수 있다.
드래그를 통해 각 작은 부품의 표시 크기를 쉽게 변경할 수 있습니다.

CloudWatch와 협업할 수 있는 서비스 목록


EC2, ECS, S3 등 여러 서비스의 데이터를 합산할 수 있습니다.


CloudWatch 관련 용어

  • Namespaces(네임스페이스)
  • 부재
  • 차원
  • 미터법
  • 통계 정보
  • 무엇이 명명 공간입니까?(Namespaces)


    여기서 이름 공간은 AWS의 서비스 이름(예: EC2 및 ECS)입니다.

    부품은 무엇입니까?(widget)


    데이터의 표시 방법은 접선, 면적, 수치, 조형도 등을 선택할 수 있다.부품으로 선택합니다.

    도표의 자유도가 매우 높다.예를 들어, 폴리라인의 경우 두 축 디스플레이, 범례의 위치, 차트의 최대값, 최소값 설정, 주석의 표시 등을 수행할 수 있습니다.

    무엇이 차원입니까?(Dimensions)


    이곳의 비트는 합계 방법의 절분 방법이다.
    예를 들어, EC2의 스토리지 사용률을 그래픽화하려는 경우 각 인스턴스의 스토리지 사용률을 표시할 것인지 아니면 EC2의 전체 스토리지 사용량을 출력할 것인지 등을 결정합니다.

    각 자동 조정 그룹, 각 이미지 ID, 각 인스턴스 등은 모두 비트입니다.

    도량이 무엇입니까?


    합계된 데이터를 가리키다.CPU 사용률, 메모리 사용률, 오류 발생 수 등.
    ▶ 메트로폴리탄의 한 예

    메트릭 선택 프로세스


    대시보드를 선택합니다.이번 테스트 선택.

    ↓ 부품 추가 선택

    ↓ 선 선택

    ↓ 도량 선택(이렇게 하면 도량을 사용하여 도표를 만들 수 있다)

    ↓ 이름 공간 선택 EC2

    ↓ 차원 선택 모든 실례

    ↓ 메트릭 CPU 사용률 선택

    위에서 지정한 도량에서 작은 부품을 작성합니다.

    주기란 무엇입니까?(Period)


    데이터의 합계 주기.예를 들어 1시간, 1일, 1개월(30일) 단위입니다.

    무엇이 통계입니까?(Statistic)


    데이터의 합계 방법.예를 들어 평균값, 최대값 등이다.
    Sum
    Max
    Min
    Average
    Sample count
    Percentile

    Percentile란 무엇입니까?


    모든 데이터를 작은 것부터 큰 것까지 정렬하고 전체를 100%로 설정하면 지정한% 데이터입니다.
    p10 또는 p85의 형식으로 표시하다.(p10 = 10%)
    예를 들어 지정된 기간 동안 CPU 사용률이 100개인 데이터의 경우 p10이면 사용량이 낮은 쪽에서 10%에 해당하는 데이터가 된다.
    p50이면 퍼센트 블록의 중앙부 데이터가 됩니다.(평균과 다른 값)

    Percentile 사용의 이점


    평균치라면 돌발적인 이상치도 평균화되어 때로는 실상을 보기 어려울 때가 있다.
    % 를 사용하면 실제에 더 가까운 값을 얻을 수 있습니다.

    경찰에 신고하다


    경고 상태


    경보의 상태는 3개다.
  • OK
  • NG
  • 데이터 부족
  • 경고 설정


    경보 설정은 주로 세 가지 지표가 있다.
  • 기간(Period)
  • 최신 데이터를 기준으로 하는 기간
  • 임계값 초과 데이터 수(Datapoints to Alarm)
  • 실제 설정 예


    예를 들어, 다음과 같이 설정된 경우 최근 3개의 데이터가 모두 임계값을 초과하면 경고가 발생합니다.
    · 최신 데이터를 기준으로 하는 기간(Evaluation Period) = 3
    /설정된 임계값을 초과한 데이터 수(Datapoints to Alarm) = 3

    데이터 손실 시


    데이터가 손실되었을 때(전송되지 않았을 때)에 해당하는 다음 중에서 선택할 수 있습니다.
  • Good(not breaching): 손실 데이터는 한도값에 있습니다.
  • Bad(breaching): 손실 데이터는 한도값 범위에 없습니다.
  • Ignore: 최근 경고 상태 문의
  • Missing: 과거로 거슬러 올라가는 시간대
  • breaching은 위반 상태를 가리킨다.이것은 한도값을 초과한 상태입니다.
    설정의 예로 CPU 사용률처럼 심각하지 않으면 Good, 오류가 발생하면 즉시 이상을 감지해야 하는 경우 Bad를 설정합니다.

    좋은 웹페이지 즐겨찾기