Datadog에서 장기간의 그래프 표시에서도 피크를 알 수 있는 설정

3542 단어 Datadog

요점



· [중요] Datadog의 그래프는 표시하는 시간 범위에 350 데이터 포인트까지 표시한다
· 쿼리 결과에 대해 rollup(method,time)을 설정하면 여러 데이터 포인트를 함께 표시할 수 있습니다.

이번에 설정할 데이터



AWS cloudwatch에서 얻은 지표 (RDS CPU 사용률)

곤란한 점



단시간(1h,4h)으로 표시하면 1분 간격의 데이터가 표시되지만, 장시간(1week,1month)으로 표시되면
시간 평균이 되어 데이터의 피크가 숨어 버리는 경우가 있습니다.

그림 1: 시간 범위 1month에서 RDS의 CPU 사용률을 표시한 예


그림 2: 위의 30% 부분을 시간 범위 5h로 표시


일일이, 시간 설정을 단시간으로 해 조사하는 것은 번거롭기 때문에, 장시간의 그래프 표시의 때에서도 피크를 알고 싶다. 라는 것이 이번 요건입니다.

공식 문서로 조사해 보았다.



Datadog 공식 문서 「그래프 표시 입문」
htp // // cs. 다만 ghq. 코 m / 그럼 / g 등 p 힌지 g /

상급자용의 함수의 하나가 .rollup()입니다. 이 함수를 쿼리에 추가하면 여러 지점을 단일 지점으로 결합할 수 있습니다. 이 함수는 "메드> 소드"와 "시간"의 두 매개 변수를 인수로 지정할 수 있습니다. (예: .rollup(method,time))

“메소드” 부분에는 sum/min/max/count/avg를 지정할 수 있습니다. "시간"은 초 단위로 지정됩니다. "메소드"와 "시간"은 개별적으로 지정(예: >.rollup(20))하거나 둘 다 조합하여(예: .rollup(sum,120))도 지정할 수 있습니다. 이 .rollup()에는 체크 기구가 있습니다. > 그러나 Datadog의 그래프에서는 표시하는 시간의 범위에 근거해 350의 데이터 포인트까지 밖에 보유하고 있지 않기 때문에, 기간 지정을 1개월로 한 경우는, 20초 간격 이상?>의 정밀도로 데이터 포인트가 보유되어 따라서 20초에서 롤업 .rollup(20)은 작동하지 않습니다.

공식 문서에 의하면, 「Datadog의 그래프에서는 표시하는 시간의 범위에 근거해 350의 데이터 포인트까지 밖에 보유하고 있지 않다」라고 하는 것입니다. 데이터 포인트를 350까지 밖에 표시하지 않기 때문에, 시간의 범위에 의해 그래프의 표시가 시간 평균되어 버리는 것 같습니다.

거기서 설정하는 것이, 상기에 써 있는 대로 rollup(method,time)입니다.
((나도 이것을 설정할 수 있다는 것은 상급자의 동료인가........))
CPU 상승 등의 그래프로 알고 싶은 것은 평균이 아니고, 최대이므로 method는 max를 선택합니다.

cloudwatch로부터 취득되고 있는 값이 60초 간격이므로, time는 60으로 좋을 것 같다. rollup(max)에서도 설정할 수 있으므로, time를 설정하는지는 임의입니다.

설정 방법



1. 대상 그래프의 연필 마크의 Edit this graph를 선택
그림 3:Edit this graph


2. 변경하고 싶은 쿼리의 [+] Add functions and modifiers를 선택
그림 4:Add functions and modifiers


3.rollup을 선택하고 avg에서 max로 변경합니다.
그림 5: max로 변경


4. JSON 설정에서 rollup (max, 60)을 rollup (max)로 변경 (선택 사항)
그림 6: JSON 파일 수정


5. 설정 후 그래프 확인
그림 7: [rollup 설정 후] 시간 범위 1month에서 RDS의 CPU 사용률을 표시한 경우


이제 장시간 규모로 언제 무엇이 발생했는지 보기 쉬워졌습니다.

Datadog의 그래프 표시는 아직 설정의 보람이 있기 때문에, 궁리와 지혜가 필요하네요.
뭔가 불명점 · 실수가 있으면, 코멘트 받을 수 있으면 매우 고맙습니다.

좋은 웹페이지 즐겨찾기