2달 전

AVA를 위한 더 나은 기준선

Rohit Girdhar; João Carreira; Carl Doersch; Andrew Zisserman
AVA를 위한 더 나은 기준선
초록

AVA 데이터셋에서 행동 위치 추정을 위한 간단한 기준 모델을 소개합니다. 이 모델은 Faster R-CNN 바운딩 박스 검출 프레임워크를 기반으로 하며, 순수한 시공간 특징에 적용하도록 조정되었습니다. 본 연구에서는 Kinetics에서 사전 학습된 I3D 모델에 의해 독점적으로 생성된 시공간 특징을 사용하였습니다. 이 모델은 AVA v2.1의 검증 세트에서 평균 AP가 21.9%로, 원래 AVA 논문에서 사용된 최고의 RGB 시공간 모델(이 모델은 Kinetics와 ImageNet에서 사전 학습됨)의 14.5%보다 향상되었으며, ImageNet에서 사전 학습된 ResNet101 이미지 피처 추출기(공개 기준 모델)를 사용한 경우의 11.3%보다도 높습니다. 우리의 최종 모델은 검증/테스트 세트에서 22.8%/21.9% mAP를 달성하였으며, CVPR 2018의 AVA 챌린지에 제출된 모든 결과를 능가하였습니다.