2달 전

캡슐 오토인코더를 이용한 비지도 운동 표현 학습

Ziwei Xu; Xudong Shen; Yongkang Wong; Mohan S Kankanhalli
캡슐 오토인코더를 이용한 비지도 운동 표현 학습
초록

우리는 비지도 동작 표현 학습에서 주요 과제인 변환 불변성을 해결하기 위해 모션 캡슐 오토인코더(Motion Capsule Autoencoder, MCAE)를 제안합니다. MCAE는 동작을 두 단계의 계층 구조로 모델링합니다. 하위 단계에서는 시공간적 동작 신호가 짧고 국소적이며 의미론적으로 무관한 조각(snippets)으로 나뉩니다. 상위 단계에서는 이러한 조각들이 결합되어 전체 길이의 의미론적으로 인식 가능한 세그먼트를 형성합니다. 두 단계 모두에서 우리는 새로운 설계의 캡슐 오토인코더를 사용하여 학습된 변환 불변 템플릿과 해당 기하학적 변환을 표현합니다. 이는 시점 변화의 강력하고 효율적인 인코딩을 가져옵니다. MCAE는 새로운 Trajectory20 동작 데이터셋과 다양한 실제 스켈레톤 기반 인간 행동 데이터셋에서 평가되었습니다. 특히, Trajectory20에서 기존 베이스라인보다 훨씬 적은 매개변수로 더 좋은 결과를 달성하였으며, 비지도 스켈레톤 기반 행동 인식 작업에서 최신 수준의 성능을 보여주었습니다.

캡슐 오토인코더를 이용한 비지도 운동 표현 학습 | 최신 연구 논문 | HyperAI초신경