11일 전
강력한 백본이 강력한 특징과 만날 때 — Ego4D 모먼트 쿼리 챌린지 위한 ActionFormer
Fangzhou Mu, Sicheng Mo, Gillian Wang, Yin Li

초록
이 보고서는 2022년 Ego4D Moment Queries 챌린지에 대한 우리 팀의 참가 결과를 기술한다. 우리 제출물은 시계열 행동 탐지 분야에서 최고 성능을 기록하는 ActionFormer을 기반으로 하며, SlowFast, Omnivore, EgoVLP에서 도출한 세 가지 강력한 비디오 특징을 결합하였다. 제출한 솔루션은 공개 리더보드에서 2위를 기록하였으며, 테스트 세트에서 평균 mAP가 21.76%로 공식 베이스라인보다 거의 3배 높은 성능을 달성하였다. 또한, tIoU=0.5 기준에서 테스트 세트에서 Recall@1x가 42.54%를 기록하여 1위 솔루션보다 1.41%p의 절대 점수 차이로 우수한 성능을 보였다. 코드는 다음 링크에서 공개되어 있다: https://github.com/happyharrycn/actionformer_release.