데이터베이스 시스템 경고 메커니즘

author:skate
time:2012/03/27
 
데이터베이스 시스템 경고 메커니즘
 
경 보 는 제때에 오 류 를 제시 할 수 있 을 뿐만 아니 라 잠재 적 인 위험 도 예방 할 수 있다. 대략 다음 과 같은 기능 이 있어 야 한다. 1. 오류 데이터 경고 2. 성능 데이터 경고 3. 데이터베이스 운행 추세 경보 (성능 추세, 공간 추세, 거래 추세 등)
 
상기 기능 을 실현 하기 위해 저 는 plsql + 셸 스 크 립 트 를 통 해 이메일 과 문자 메 시 지 를 통 해 경 고 를 했 습 니 다.
 
一.报警机制:(短信或email)
 
报警机制采用
模式:本地报警+监控中心报警模式
技术:Plsql和shell脚本
 
 
DB系统的监控
A:os层:性能数据,故障数据
B:db层:性能数据,故障数据
 
A:os层:性能数据,故障数据
    Os层粗粒度监控:通过监控os的load和db连接数来报警发email或短信
    Os层细粒度监控:通过监控os的swap,iops,throught,pagein/out,network等报警发email或短信。
B:db层:性能数据,故障数据
   DB故障监控:JOB,alertlog,checkpoit,表空间,dg,rac等,通过本地部署脚本短信报警
   DB性能监控:连接数、事务数、读写比例、归档量、sql数量与执行次数、空间使用率等,通过监控中心分析收集的信息定时email发周报,预测数据库近一周的使用情况。
 
说明:
DB层性能监控原理:监控端部署收集信息脚本,定时把监控数据发送到监控中心45,监控中心45通过分析脚本,完成周报的发送。
 
 
二.报警的级别
1.根据信息影响范围,把报警分为三级
  info:提示信息报警,对业务无任何影响,可以在方便的时间处理
  waring:警告信息报警,紧急度不是很高,但也要及时处理,避免恶化
  error:错误信息报警,需立即处理
2.为了提高报警的准确度和避免报警麻木,对于info级别的报警采用提示与校验合并方法来保证。
  A:第一次报警发短信或email
  B:然后如果n(n>1)次连续报警,将报警自动升级(即info->waring,warning ->error)并短信或email
 
 
 
---------------end---------------
 

좋은 웹페이지 즐겨찾기