2 个月前
时空动作定位中的关系建模
Yutong Feng; Jianwen Jiang; Ziyuan Huang; Zhiwu Qing; Xiang Wang; Shiwei Zhang; Mingqian Tang; Yue Gao

摘要
本文介绍了我们在CVPR 2021年ActivityNet研讨会的AVA-Kinetics交叉挑战赛中提出的解决方案。我们的方案利用了多种关系建模方法进行时空动作检测,并采用了一种训练策略,以在两个大规模视频数据集上实现端到端的多关系建模集成。此外,我们还研究了使用记忆库学习和针对长尾分布的微调方法,以进一步提升性能。本文详细描述了我们解决方案的实现过程,并提供了实验结果及相应的讨论。最终,我们在AVA-Kinetics测试集上达到了40.67 mAP(mean Average Precision)的成绩。