2달 전
Kinetics-600에 대한 짧은 주석
Joao Carreira; Eric Noland; Andras Banki-Horvath; Chloe Hillier; Andrew Zisserman

초록
우리는 각각 최소 400개의 비디오 클립을 포함하는 400개 클래스에서 각각 최소 600개의 비디오 클립을 포함하는 600개 클래스로 확장된 DeepMind Kinetics 인간 행동 데이터셋에 대해 설명합니다. 데이터셋을 확대하기 위해, 우리는 클래스당 여러 개의 쿼리를 사용하도록 데이터 수집 과정을 변경하였으며, 일부 쿼리는 영어 외의 언어인 포르투갈어를 사용하였습니다. 본 논문은 두 버전의 데이터셋 간의 변경 사항을 상세히 기술하고, 새로운 버전의 포괄적인 통계 정보와 I3D 신경망 아키텍처를 사용한 베이스라인 결과를 포함합니다. 이 논문은 공공 테스트 세트의 참값 라벨이 공개되는 것과 함께 제공됩니다.