DB Predictive Detection

AWR 스냅 샷 + Oracle R Enterprise를 결합하여 Oracle DB와 관련된 장애 (주로 성능 시스템)를 예측할 수 없는지 파악할 계획입니다.

Oracle R Enterprise는 DB에 저장된 데이터를 투명하게 처리할 수 있으므로 DB와의 친화성이 높으며 DB에서 검색하여 집계한 데이터를 DB에 다시 저장할 수 있습니다. . 덧붙여 통계의 지식이 얕기 때문에 어드바이스나 코멘트를 받을 수 있으면 기쁩니다.

동기 부여



Oracle DB를 운영 할 때,

  • 장애를 사전에 감지하고 싶습니다.
  • 비정상적으로 급격한 대기 시간의 증감을 볼 수 없는가?


  • 시스템의 성장률을 예측하고 싶습니다.
  • 대기 시간이 증가하는 경향이 있는가?
  • 한계는 언제 방문할까?


  • 같은 요청이 있다고 가정합니다.

    기본적인 접근



    정기적으로(기본적으로 1시간마다) 취득되는 AWR 스냅샷의 정보를 바탕으로 주로 DB CPU나 대기 시간에서 이상치의 검출이나 향후 성장률을 예측해 나갑니다.

    예조 감지를 고려할 때 다음을 전제 조건으로 합니다.
  • RAC 환경의 경우 각 인스턴스에 로드가 균등하게 걸려 있습니다(응용 프로그램 파티셔닝 등에서 인스턴스별 부하 경향이 다른 경우 각 인스턴스별로 분석해야 합니다. 단순화를 위해 모든 인스턴스에 고르게 부하가 있다고 가정합니다.)
  • 처리 부하 경향은 24시간 동안 거의 동일한 경향을 보이고 있다(OLTP 시스템에서는 하루의 특정 시간대에 부하가 집중되는 경향이 있으며 그 경향이 크게 변하지 않는다고 가정한다. 라고 합니다.)

  • 접근(1)



    어제까지의 AWR 스냅샷에서 DB CPU를 추출하여 상자 수염 다이어그램을 출력합니다. 출력된 상자 수염 다이어그램과 오늘의 DB CPU 추세를 비교하여 이상치가 없는지 확인합니다. 연속적으로 이상치가 나타난 경우에는, 지금까지와 경향이 다른 상태라고 판단해, DBA 에 예조 검출을 통지합니다.

    [DB CPU 상자 수염 다이어그램 샘플]


    이 시스템에서는
  • 18:00-19:00에 부하의 피크가 오는 경향이 있다
  • 4:00-5:00이 가장 부하가 낮다

  • 같은 경향을 파악할 수 있습니다. 이 결과와 오늘의 DB CPU를 비교하면 평상시와 비슷한 경향인지 파악할 수 있습니다.
    Oracle Enterprise Manager를 사용하면 실시간으로 처리 상태를 파악할 수 있지만 과거의 추세와 비교하지 않으므로 사전 탐지가 어렵습니다.

    접근(2)



    계속 검토 중...

    좋은 웹페이지 즐겨찾기