논문 요약: Human activity recognition based on time series analysis using U-Net

소개



Net에서 찾은 다음 논문
[1] Y. Sun, et. al "Human activity recognition based on time series analysis using U-Net"
의 거친 정리.

accept된 journal 등은 불명.

arXiv:
htps : // 아 rぃ v. rg/아bs/1809.08113

개요


  • 시계열 데이터를 분석하여 사람의 행동 인식을 수행하는 모델
  • 이전 방법의 sliding window에서 잘라낸 sequential 마다 행동을 부여하는 것이 아니라, 각 시간마다 행동을 부여한다
  • 이것을 U-Net 구조를 사용함으로써 달성

  • 기존의 기계 학습을 이용한 기술



    기계 학습을 이용하여 시계열 데이터를 해석하고, 사람의 행동 인식을 실시하는 모델의 종래 수법(deep learning 이전)은 논문을 철저히 정리하면 이런 느낌인가?



    1) 먼저 시계열 데이터에서 일부 시퀀스를 잘라냅니다.

    2) 그것에 전처리를 실시한다.

    3) 다음으로 특징량을 추출한다. 이것은 원시 데이터에서 추출하는 경우와 FFT 등으로 주파수 영역으로 날아가 거기에서 추출하는 경우가 있다.

    4) 마지막으로 특징량을 이용하여 행동을 분류한다. SVM이나 결정 트리 등을 이용한다. 모든 특징 량을 사용하는 경우와 차원 압축 후 사용하는 경우가 있습니다.

    이들은 핸드메이드인 특징량 추출기이므로, 최종적인 분류 정밀도가 두드려.

    deep learning을 이용한 종래의 방법



    이에 대해, deep learning을 사용하면 아래 그림과 같은 느낌인가?



    1) 다시 시계열 데이터에서 일부 시퀀스를 잘라냅니다.

    2) 거기에 전처리를 한다

    3) 1-d conv와 RNN을 이용하여 특징량 추출 및 분류를 단번에 실시한다. 논문에는 없지만 3, 4년 전에 유행한 2-d conv도 넣어 보았다.

    특징량 추출기도 학습함으로써 정밀도의 향상을 기대할 수 있다.

    그러나 저자가 말하는 곳에 "multi-class window problem"는 남아 있다.

    이것은 sliding window에서 잘라낸 sequential에 대해 항상 하나의 행동이 부여된다는 문제. 행동의 전환 부분에서는 2개 이상의 행동이 대응할 것.

    제안 기법의 아키텍처



    제안 방법은 이하.



    U-Net 구조를 사용하면 각 시간에 대한 행동을 부여 할 수 있습니다. 이제 "multi-class window problem"을 극복할 수 있다.

    실험 및 결과



    7개의 dataset에서 다른 수법과 accuracy, F1-score로 비교한 결과는 이하.



    표시하고 있는 수치는 각 dataset에 있어서 accuracy, F1값을 평균한 것.

    U-Net이 가장 높다.

    좋은 웹페이지 즐겨찾기