Global Accelerator로 AWS의 장애를 피하면

AWS의 장애
어젯밤(2021-12-16 일본시간 0시가 넘어) 미국 측의 AWS가 고장난 것 같습니다.
트위터 인근에서 플레이스테이션네트워크가 휘말려 큰 소동을 일으킨 것도 우리 감시시스템에서 감지됐지만, AWS의 스테이츠에는 고장 정보가 없었다.
Dell 서비스 환경
우리 회사는 DNS 서비스QUALITIA DNS를 운용하지만 DNS를 낮출 수 없기 때문에 여러 클라우드 서비스와 구역으로 분산시켜 운용한다.
이 가운데 AWS가 운용하는 부분은 현재 일본, 싱가포르, 프랑크푸르트, 샌프란시스코에 서버가 있어 글로벌 액셀러레이터에 지역을 이중화했다.
아울러 AWS의 도쿄 지역, 일본의 AWS 이외의 서버, 샌프란시스코의 AWS 이외의 서버는 각자의 서버와 글로벌 액셀러레이터를 감시하고 있다.

각 모니터링 소스의 상태
이것은 모든 감시 원본의 실패 도표입니다.

녹색은 일본에서 온 AWS 이외의 서버, 보라색은 샌프란시스코에서 온 AWS 이외의 서버, 파란색은 AWS에서 온 도쿄 지역의 감시 상황.
DNS 요청은 실패한 수의 차트입니다.
이걸 보면 AWS 안에는 문제가 없어요. 밖에서 AWS로 가는 회선에 무슨 문제가 있는 것 같아요.

붉은 선은 장애가 있는 노선이다.
서버당 상태
이것은 모든 감시 대상의 실패 도표입니다.
failed_by_server.png
ns-sf-*는 샌프란시스코 지역을 직접 감시하는 서버이며, ns-ga-*는 글로벌 액셀러레이터를 통해 감시한다.
b, c는 Availability Zone입니다.
이걸 보면 서버가 바로 고장이 났지만 글로벌 액셀러레이터를 통해 다른 살아있는 구역으로 옮겨져 일본에서 샌프란시스코까지 연결하는 데 문제가 없다는 것을 알게 됐다.
이 결과로 AWS 네트워크 안이 살아있다는 것을 상상할 수 있다. 인터넷에서 샌프란시스코 부근의 AWS 네트워크까지 이상하지 않은가.
결론
따라서 QUALITIA DNS 서비스의 고객들은 거의 멈추지 않았다.
진짜 대박이다.
* 본 기사는 @qualitia_cdev 중 한 분@hirachan 선생이 쓴 것입니다.

좋은 웹페이지 즐겨찾기