「이상 검지와 변화 검지」 제7장 방향 데이터의 이상 검지

2177 단어 공부회

7.1 방향 데이터의 확률 분포



방향 데이터란?



길이 1로 표준화된 M차원 벡터. 방향에만 정보가 있다.


폰 미제스 피셔 분포



$M(x|\mu,\kappa) =\frac{\kappa^{M/2-1}}{(2\pi)^{M/2}I_{M/2-1}(\kappa) } exp(\kappa\mu^{T}x)$
  • 평균 방향$\mu$
  • 집중도 $\kappa$
  • 제1종 변형 베셀 함수 $I_{\alpha}(\kappa)$



  • 7.2 평균 방향의 최대 우도 추정



    분포의 파라미터 중 평균 방향을 데이터로부터 추정한다. (집중도 $\kappa$는 직접 요구하지 않는다.)

    우도



    $L(\mu,\kappa|D) = ln\Pi_{n=1}^{N}c_{M}(\kappa)exp(\kappa\mu^Tx^{(n)}) =\sum_ {n=1}^{N}(lnc_{M}(\kappa) +\kappa\mu^Tx^{(n)})$

    최대 우도 추정



    우도 $L$를 최대화하는 평균 방향 벡터 $\mu$를 구한다.

    구속조건 $\mu^T\mu = 1$를 라그랑주 계수로 캡처하여 풀면

    $\hat{\mu} =\frac{m}{\sqrt{m^Tm}}$

    $m\equiv\frac{1}{N}\sum_{n=1}^{N}x^{(n)}$

    결과는 데이터 평균 벡터를 길이 1로 정규화한 것

    7.3 방향 데이터의 이상도와 그 확률 분포



    이상도 정의



    데이터 $x'$의 이상도

    $a(x') = 1- μ^Tx'$

    평균 방향 벡터 $\mu$와의 거리를 내적을 이용하여 표현.

    이상도 확률 분포



    결론 : 이상도 $a $의 확률 분포는 χ 제곱 분포입니다.

    $M(\mu,\kappa)$에 따른 $x'$가 있을 때, 이상도 $a$의 분포는

    $p(a) =\int_{S_M}dx\delta(a-(1-\mu^Tx)) C_M(\kappa)exp(\kappa\mu^Tx)$

    $u=\cos\theta_1$를 사용하여 대체 적분하고 $a\ll1$를 사용하면

    $p(a)\propto a^{(M-1)/2-1}exp(-\kappa a)$

    이것은 자유도 $M-1$, 스케일 인자 $1/2\kappa$의 χ 제곱 분포

    7.4 적률법에 의한 χ 제곱 분포의 적용



    χ 제곱 분포의 매개 변수 $ m, s $는 데이터에서 추정됩니다.

    $ m, s $의 χ 제곱 분포의 1 차/2 차 모멘트는

    $=\int_0^{\infty}a\chi^2(a|m,s)da = ms$$ =\int_0^{\infty}a^2\chi^2(a|m,s)da = m (m+2)s^2 $데이터로부터 구한 이하의 a의 1차·2차 모멘트를 이들과 등치해, $m, s$를 구한다$=\frac{1}{N}\sum_{n=1}^{N}a^{(n)}$$ =\frac{1}{N}\sum_{n=1}^{N}a ^{(n)^2}$요구한 $\hat{m}_{mo}$는 일반적으로 M보다 작은 것이 많아 데이터의 유효 차원으로 해석할 수 있다.

    좋은 웹페이지 즐겨찾기