2달 전

ConvNet 아키텍처 검색을 통한 시공간 특성 학습

Du Tran; Jamie Ray; Zheng Shou; Shih-Fu Chang; Manohar Paluri
ConvNet 아키텍처 검색을 통한 시공간 특성 학습
초록

ImageNet에서 사전 학습을 통해 ConvNets를 사용하여 이미지 표현을 학습하는 것이 객체 검출, 의미 분할, 이미지 캡셔닝 등 많은 시각 이해 작업에 유용하다는 것이 입증되었습니다. 비록 어떤 이미지 표현도 비디오 프레임에 적용될 수 있지만, 모션 패턴을 외관 기반 모델만으로 포착할 수 없는 경우를 고려하면 전용 시공간 표현이 여전히 중요합니다. 본 논문에서는 시공간 특징 학습을 위한 경험적 ConvNet 아키텍처 탐색을 제시하며, 이는 깊은 3차원(3D) 잔차 ConvNet으로 집약됩니다. 제안된 아키텍처는 스포츠-1M, UCF101, HMDB51, THUMOS14, ASLAN 데이터셋에서 C3D보다 크게 우수한 성능을 보이며, 추론 시간은 2배 빠르고, 모델 크기는 2배 작으며, 더 압축된 표현을 가지고 있습니다.

ConvNet 아키텍처 검색을 통한 시공간 특성 학습 | 최신 연구 논문 | HyperAI초신경