「이상 검지와 변화 검지」 제7장 방향 데이터의 이상 검지
2177 단어 공부회
7.1 방향 데이터의 확률 분포
방향 데이터란?
길이 1로 표준화된 M차원 벡터. 방향에만 정보가 있다.
폰 미제스 피셔 분포
$M(x|\mu,\kappa) =\frac{\kappa^{M/2-1}}{(2\pi)^{M/2}I_{M/2-1}(\kappa) } exp(\kappa\mu^{T}x)$
7.2 평균 방향의 최대 우도 추정
분포의 파라미터 중 평균 방향을 데이터로부터 추정한다. (집중도 $\kappa$는 직접 요구하지 않는다.)
우도
$L(\mu,\kappa|D) = ln\Pi_{n=1}^{N}c_{M}(\kappa)exp(\kappa\mu^Tx^{(n)}) =\sum_ {n=1}^{N}(lnc_{M}(\kappa) +\kappa\mu^Tx^{(n)})$
최대 우도 추정
우도 $L$를 최대화하는 평균 방향 벡터 $\mu$를 구한다.
구속조건 $\mu^T\mu = 1$를 라그랑주 계수로 캡처하여 풀면
$\hat{\mu} =\frac{m}{\sqrt{m^Tm}}$
$m\equiv\frac{1}{N}\sum_{n=1}^{N}x^{(n)}$
결과는 데이터 평균 벡터를 길이 1로 정규화한 것
7.3 방향 데이터의 이상도와 그 확률 분포
이상도 정의
데이터 $x'$의 이상도
$a(x') = 1- μ^Tx'$
평균 방향 벡터 $\mu$와의 거리를 내적을 이용하여 표현.
이상도 확률 분포
결론 : 이상도 $a $의 확률 분포는 χ 제곱 분포입니다.
$M(\mu,\kappa)$에 따른 $x'$가 있을 때, 이상도 $a$의 분포는
$p(a) =\int_{S_M}dx\delta(a-(1-\mu^Tx)) C_M(\kappa)exp(\kappa\mu^Tx)$
$u=\cos\theta_1$를 사용하여 대체 적분하고 $a\ll1$를 사용하면
$p(a)\propto a^{(M-1)/2-1}exp(-\kappa a)$
이것은 자유도 $M-1$, 스케일 인자 $1/2\kappa$의 χ 제곱 분포
7.4 적률법에 의한 χ 제곱 분포의 적용
χ 제곱 분포의 매개 변수 $ m, s $는 데이터에서 추정됩니다.
$ m, s $의 χ 제곱 분포의 1 차/2 차 모멘트는
$=\int_0^{\infty}a\chi^2(a|m,s)da = ms$$ =\int_0^{\infty}a^2\chi^2(a|m,s)da = m (m+2)s^2 $데이터로부터 구한 이하의 a의 1차·2차 모멘트를 이들과 등치해, $m, s$를 구한다$=\frac{1}{N}\sum_{n=1}^{N}a^{(n)}$$ =\frac{1}{N}\sum_{n=1}^{N}a ^{(n)^2}$요구한 $\hat{m}_{mo}$는 일반적으로 M보다 작은 것이 많아 데이터의 유효 차원으로 해석할 수 있다.
Reference
이 문제에 관하여(「이상 검지와 변화 검지」 제7장 방향 데이터의 이상 검지), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/rocketboya/items/98d782d138aa059507f7
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
이상도 정의
데이터 $x'$의 이상도
$a(x') = 1- μ^Tx'$
평균 방향 벡터 $\mu$와의 거리를 내적을 이용하여 표현.
이상도 확률 분포
결론 : 이상도 $a $의 확률 분포는 χ 제곱 분포입니다.
$M(\mu,\kappa)$에 따른 $x'$가 있을 때, 이상도 $a$의 분포는
$p(a) =\int_{S_M}dx\delta(a-(1-\mu^Tx)) C_M(\kappa)exp(\kappa\mu^Tx)$
$u=\cos\theta_1$를 사용하여 대체 적분하고 $a\ll1$를 사용하면
$p(a)\propto a^{(M-1)/2-1}exp(-\kappa a)$
이것은 자유도 $M-1$, 스케일 인자 $1/2\kappa$의 χ 제곱 분포
7.4 적률법에 의한 χ 제곱 분포의 적용
χ 제곱 분포의 매개 변수 $ m, s $는 데이터에서 추정됩니다.
$ m, s $의 χ 제곱 분포의 1 차/2 차 모멘트는
$=\int_0^{\infty}a\chi^2(a|m,s)da = ms$$ =\int_0^{\infty}a^2\chi^2(a|m,s)da = m (m+2)s^2 $데이터로부터 구한 이하의 a의 1차·2차 모멘트를 이들과 등치해, $m, s$를 구한다$=\frac{1}{N}\sum_{n=1}^{N}a^{(n)}$$ =\frac{1}{N}\sum_{n=1}^{N}a ^{(n)^2}$요구한 $\hat{m}_{mo}$는 일반적으로 M보다 작은 것이 많아 데이터의 유효 차원으로 해석할 수 있다.
Reference
이 문제에 관하여(「이상 검지와 변화 검지」 제7장 방향 데이터의 이상 검지), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/rocketboya/items/98d782d138aa059507f7
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
Reference
이 문제에 관하여(「이상 검지와 변화 검지」 제7장 방향 데이터의 이상 검지), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/rocketboya/items/98d782d138aa059507f7텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)