2달 전
계층적 벡터 양자화를 이용한 비지도 행동 분할
Spurio, Federico ; Bahrami, Emad ; Francesca, Gianpiero ; Gall, Juergen

초록
본 연구에서는 감독되지 않은 시계열 행동 분할 문제를 다루며, 이는 긴, 편집되지 않은 여러 동영상을 의미上有한 세그먼트로 나누고, 이러한 세그먼트가 동영상 간에 일관성을 유지하도록 하는 작업입니다. 최근의 접근 방식들은 이 작업을 위해 표현 학습과 클러스터링을 단일 단계에서 결합하지만, 같은 클래스 내의 시간적 세그먼트에서 발생하는 큰 변동성을 처리하지 못합니다. 이러한 제한점을 해결하기 위해, 우리는 두 개의 연속적인 벡터 양자화 모듈로 구성된 새로운 방법인 계층적 벡터 양자화(Hierarchical Vector Quantization, HVQ)를 제안합니다. 이를 통해 추가적인 하위 클러스터가 클러스터 내의 변동성을 포괄하는 계층적 클러스터링이 이루어집니다. 우리는 본 접근 방식이 기존 최신 기술보다 세그먼트 길이 분포를 훨씬 더 잘 포착함을 보여줍니다. 이를 위해, 우리는 감독되지 않은 시계열 행동 분할을 위한 새로운 지표인 Jensen-Shannon 거리(Jensen-Shannon Distance, JSD) 기반 메트릭을 도입합니다. 본 접근 방식은 Breakfast, YouTube Instructional 및 IKEA ASM라는 세 가지 공개 데이터셋에서 평가되었으며, F1 점수, 재현율 및 JSD 측면에서 기존 최신 기술을 능가하는 성능을 보였습니다.