2달 전

비디오 인식을 위한 SlowFast 네트워크

Christoph Feichtenhofer; Haoqi Fan; Jitendra Malik; Kaiming He
비디오 인식을 위한 SlowFast 네트워크
초록

우리는 비디오 인식을 위한 SlowFast 네트워크를 제시합니다. 본 모델은 (i) 낮은 프레임 속도에서 작동하여 공간적 의미를 포착하는 Slow 경로와 (ii) 높은 프레임 속도에서 작동하여 시간적 해상도가 높은 움직임을 포착하는 Fast 경로를 포함합니다. Fast 경로는 채널 용량을 줄여 매우 가벼운 구조로 만들 수 있으며, 그럼에도 불구하고 비디오 인식에 유용한 시간적 정보를 학습할 수 있습니다. 우리의 모델들은 비디오에서 행동 분류와 감지 모두에서 강력한 성능을 보이며, SlowFast 개념의 기여로 인해 큰 개선이 이루어졌음을 확인할 수 있습니다. 우리는 주요 비디오 인식 벤치마크인 Kinetics, Charades 및 AVA에서 최고의 정확도를 보고합니다. 코드는 다음과 같은 주소에서 제공됩니다: https://github.com/facebookresearch/SlowFast