13일 전

계층적 액션 분류를 위한 네트워크 프루닝

Mahdi Davoodikakhki, KangKang Yin
계층적 액션 분류를 위한 네트워크 프루닝
초록

최근 몇 년간 인간 행동 분류에 대한 연구에서 상당한 진전이 이루어졌다. 대부분의 딥러닝 기법은 더 많은 네트워크 구성 요소를 추가함으로써 성능을 향상시키는 데 초점을 맞추고 있다. 그러나 본 연구에서는 이러한 접근 방식 대신, 계층적 분류, 네트워크 프리닝, 그리고 스켈레톤 기반 사전처리와 같은 보조 메커니즘을 보다 효과적으로 활용함으로써 모델의 강건성과 성능을 향상시키는 방안을 제안한다. 제안한 방법의 효과성을 네 가지 대표적인 테스트 데이터셋—NTU RGB+D 60, NTU RGB+D 120, Northwestern-UCLA Multiview Action 3D, UTD Multimodal Human Action Dataset—에서 검증하였다. 실험 결과, 제안한 방법은 네 가지 데이터셋 모두에서 기존 방법과 비교해 유사하거나 더 우수한 성능을 달성함을 확인하였다. 특히, 네 가지 데이터셋 중 가장 규모가 큰 NTU RGB+D 120에 대해 새로운 벤치마크 기준을 설정하였다. 또한, 광범위한 비교 실험과 아블레이션 스터디를 통해 제안 방법의 타당성과 각 구성 요소의 기여도를 체계적으로 분석하였다.

계층적 액션 분류를 위한 네트워크 프루닝 | 최신 연구 논문 | HyperAI초신경