Cross Recurrence Quantification Analysis - 이론 편

개요
이번에는 발전된 시간 서열 분석 방법 중의 하나로 교차 귀속량화 분석을 채택하고 특히 그 이론을 중심으로 총결한다.
교차 귀속량화 분석
원래 정론에 따라 역학 계통의 구조를 묘사하는 방법이다.
두 시간 서열 데이터에 근거하여 그것들이 어떻게 같은 중복 모델로 운동하는지 분석할 수 있다.
→최근 몇 년 동안 심리학 분석과 교류 실험 등에 사용되었다.
비교할 분석 방법으로 다음과 같은 방법을 열거한다.
통계량 분석: 전체 데이터의 강도, 주파수, 비례 등을 조사할 때 유효하다
교차 관련 분석: 데이터 간의 공통 변동(=co-variation)을 조사할 때 유효하다
●변화의연동시기를 알아
교차 귀속량화 분석: 데이터 간 사건의 재방문(=co-visitation)을 조사할 때 유효하다
필요한 지식
・혼돈 분석과 유도자유도자 구조 - 혼돈 분석 해설 -
상공간, 유도자, 삽입, 터빈 삽입식의 정리(상기 사이트는 매우 이해하기 쉽다!)
리자투시간 순서를 초과한 시각화
연애 줄거리에 대한 대략적인 인상
이론
대략적인 절차로서
1. 두 시간 서열 데이터 중 하나에 대해 그 유도자의 재구성 생성
2. 교차 귀환도 제작
3. 각 지표의 계산
라는 절차로 해석했다.
1. 유도자 재구성
가설 시간 서열 데이터는 하나의 동적 시스템에서 발생하고 관측된 데이터는 시스템 상태(관측할 수 없는 데이터 포함)로만 확정된다.
이때 시스템 상태의 궤적을 추정한다.
구체적으로 말하면 시간 시퀀스 데이터에서 시스템의 모든 상태 변수를 매립한다.
A. 준비 시간 시퀀스 데이터 X(t)(t=0, 1, 2,...)
B. 지각시간τ도움을 구하다
지연 시간이 너무 적으면 재구성된 점이 대각선 부근에서 이동하여 구조가 거의 붕괴되어 소음의 영향을 받기 쉽다. 너무 크면 접영효과로 인해 시간 지연 좌표 사이의 구조가 사라져 소음 특수처리를 할 수 없다.
구체적으로 지각 시간 상호 정보량 I(τ)첫 번째가 작아졌어요.τ의 값
지연 시간 상호 정보량:
I(τ) = \sum_{x_{n}, x_{n-τ}} P(x_{n}, x_{n-τ})\log_2 \frac{P(x_{n}, x_{n-τ})}{P(x_{n}) P(x_{n-τ})}
하지만
P(x_{n}):時刻nにx_{n}が起こる確率\\
P(x_{n}, x_{n-τ}):時刻nにx_{n},時刻n-τにx_{n-τ}が起こる確率
다시 말하면 X(t)와 X(t+)τ)의존도가 낮아지다τ선택하십시오.
C. 내장 차원 구하기
가짜 nearest neighbor method를 사용합니다.
우선, 타킨스의 정리로부터 어떤 유한한 삽입 차원τ_0은 상위 기하학적 성질의 유도자를 재구성할 수 있다는 것을 이미 알고 있다.
가짜nearest neighbor method에 대한 직관적인 이해로서
1. 시간 시퀀스 데이터 X(t)에서 인접한 데이터 포인트 x(t), x(t+1)(우선 1차원으로 가정하고 확장할 수 있음), 거리 계산
2. 매립으로 지연되는 시간τ1차원 증가 (결과 데이터 포인트 x (t), x (t +1) 도 1차원 확장)
3. 다시 거리를 계산하여 전거리와 후거리 비교
4. 큰 변화가 발생하면(인접점이 갑자기 멀어지면) 위상 기하학적 성질을 유지하지 않기 때문에 1로 돌아가 추가 매립한다
5. 변화가 없으면 확장 전의 삽입 차원이 적당한지 확인
공식으로 표시하면,
R^2_{D}(t,r) = \sum_{k=0}^{D-1}[x(t+kτ)-x^{(r)}(t+kτ)]^2 \\
R^2_{D+1}(t,r) = R^2_{D}(t,r) + [x(t+Dτ)-x^{(r)}(t+Dτ)]^2 \\
상대적
\frac{[x(t+Dτ)-x^{(r)}(t+Dτ)]^2}{R^2_{D}(t,r)} < R_{tolerant}  
만족하지 않는 점조는 가능한 한 줄여서 (e.g. 전체의 10%) 가장 작은 D를 차례로 구한다.
하지만
R^2_{D}(t,r):D次元ベクトルx(t)と,D次元位相空間上でx(t)とr番目に近いデータ点の距離 \\
R^2_{D+1}(t,r):D+1次元ベクトルx(t)と,D次元位相空間上でx(t)とr番目に近かったデータ点の距離
 R_{tolerant}:閾値(定数)
적당한 삽입 차원을 구하면 실제로 접근하지 않는 점이 접근하지 않을 정도로 확장할 수 있다.
2. 교차 반복 차트 만들기
우선, 위상 공간의 궤적이 다시 충분한 위치에 왔을 때 궤적 회귀를 정의한다.
A. 반지름(radius)을 정하는 느낌이 좋아요(자세한 내용은 다음에)
B. 2차원 매트릭스 CR(x, y)을 준비하여 각 차원 요소를 X, Y의 각 데이터의 총수로 만든다.
C. 각 요소 CR(i, j)의 경우 D(i, j)이렇게 해서 리카스토를 교차시키면 완성!
예: 정현파(주기 함수)의 상간도
(다음 그림은 크로스오버가 아닙니다.)
상호 정보량
교차 드로잉의 피쳐
  • 주기적인 시간 서열 데이터라면 주기적인 공간 모델이 나타나고 그렇지 않으면 비주기적인 모델이 나타난다
  • 오른쪽 위에서 왼쪽 아래로 대각선이 나타나면 사건이 시간축 없이 공동으로 발생한다는 뜻이다.
  • 대각선과 평행 대각선이 나타나면 해당 거리와 상응하는 시간축에서 사건이 공동으로 발생했음을 알 수 있다
  • 안정된 시간 서열이면 전체 공간이 통일된다
  • 종선 또는 횡선이 나타나는 경우 그 길이에 따라 안정 상태가 계속됨을 나타낸다.
  • 상술한 특징을 추출하는 지표를 한층 더 자세히 보다.
    3. 지표별 계산
    CRPs에서 얻은 지표는 다음과 같은 대표적 특징이 있다
    역귀점 밀도 지표
    (RR):
    어떤 Lag가 Coupling을 생성했는지 효과적으로 조사
    RR = \frac{1}{N~2}\sum_{i,j=1}^{N} CR_{i,j} \\
    CR_{i,j} = Θ(ε - |x_{i} - y_{j}|) \\
    ε: プロットの閾値(=radius)
    
    대각선 지표
    리비스토의 대각선을 봐라.
    P(l)=\sum_{i,j=1}^{N}(1-CR_{i-1,j-1})(1-CR_{i-l,j-l})\prod_{k=0}^{l-1}CR_{i+k,j+k} \\
    (1-CR_{i-1,j-1}):長さl未満はカウントしない \\
    (1-CR_{i+l,j+l}):長さl以上はカウントしない \\
    \prod_{k=0}^{l-1}CR_{i+k,j+k}:(i,j)からはじまる長さLの間のすべての点がプロットされているならカウントする \\
    
    (DET):
    l_min 이상의 길이를 가진 대각선을 형성하는 상간성 그림의 비율을 표시합니다. (= 고립되지 않은 그림의 비율)
    시스템의 미래 상태가 사전 상태에 의해 결정되는지 여부의 정도를 나타낸다
     DET = \frac{\sum_{l=l_{min}}^{N}lP(l)}{\sum_{l=1}^{N}lP(l)} \\
    l_{min}:最低限の長さを決める閾値パラメータ.
    
  • 최대 대각선 길이:
    지수 혼돈 생성 지표
    L_{max} = max(\{l_{i}\}_{i=1}^{N_{i}}) \\
    N_{t} = \sum_{l>>l_{min}}P(l) \\
    (=閾値以上の長さの対角線の本数の合計)
    
  • 평균 대각선 길이:
    변환 브랜치 = 시스템의 예측 가능 시간을 나타냅니다.
    L = \frac{\sum_{l=l_{min}}^{N}lP(l)}{\sum_{l=min}^{N}P(l)}
    
  • 대각선 길이 분포의 엔트로피:
    CR의 복잡성을 나타내는 지표
  • ENTR = -\sum_{l=l_{min}}^{N}p(l)\ln p(l) \\
    p(l) = \frac{P(l)}{N_{l}}:全体に占める長さlの対角線の割合
    
    수직 지표
    리콘도의 세로줄을 봐라.
    P(v)=\sum_{i,j=1}^{N}(1-CR_{i,j-1})(1-CR_{i,j+v})\prod_{k=0}^{v-1}CR_{i,j+k} \\
    (1-CR_{i,j-1}):長さl未満はカウントしない \\
    (1-CR_{i,j+v}):長さl以上はカウントしない \\
    \prod_{k=0}^{l-1}CR_{i,j+k}:(i,j)からはじまる長さVの縦線の間のすべての点がプロットされているならカウントする \\
    
  • 수직선의 귀속률(LAM:laminarity):
    v_길이가 min 이상인 세로선을 이루는 상간성도의 비율을 나타냈다(=고립되지 않은 도표의 비율)
     LAM = \frac{\sum_{v=v_{min}}^{N}vP(v)}{\sum_{v=1}^{N}vP(v)} \\
    v_{min}:最低限の長さを決める閾値パラメータ.
    
  • 수직선의 평균 길이(TT:traptime):
    시스템이 동일한 상태에서 머무는 시간을 표시합니다.
    TT = \frac{\sum_{v=v_{min}}^{N}vP(v)}{\sum_{v=min}^{N}P(v)}
    
    이런 지표로 시간 서열 데이터를 분석하다.
    총결산
    오랜만에 지상 대수식...
    나는 이론의 생각이 수학의 외관보다 더 직관적이라고 생각한다.
    나는 다음에 여력이 있을 때도 실천편을 쓰고 싶다.
    참고 자료
  • Cross-recurrence quantification analysis of categorical and continuous time series: an R package
  • 'R advent callender 2018'8일차.
  • R 및 시간 시퀀스(3)
  • CRQA(Cross-RequalLogic Qualization Analysis)
  • 리콘도의 혼돈 시간 서열에 대한 통계 분석
  • 사회 심리학자의 시간 시리즈 분석 입문
  • 역귀량화 분석을 통해 비선형 시간 서열 분석의 절차
  • 유도자 구조 - 혼돈 분석 해설 -
  • Mutual information
  • False nearest neighbors
  • Calculation of Average Mutual Information (AMI) and False-Nearest Neighbors (FNN) for the Estimation of Embedding Parameters of Multidimensional Time Series in Matlab
  • 좋은 웹페이지 즐겨찾기