2 个月前

基于3D CNNs和注意力机制的MediaEval 2022体育任务基线方法

Pierre-Etienne Martin
基于3D CNNs和注意力机制的MediaEval 2022体育任务基线方法
摘要

本文介绍了为MediaEval 2022基准测试中的体育视频任务部分提出的基线方法。该任务包含两个子任务:从剪辑视频中进行击球分类,以及从未剪辑视频中进行击球检测。本基线方法同时解决了这两个子任务。我们提出了两种类型的3D-CNN架构来解决这两个子任务。这两种3D-CNN均采用了时空卷积和注意力机制。架构和训练过程针对所解决的子任务进行了定制。该基线方法已在线公开共享,以帮助参与者在其研究过程中减轻某些方面的负担,例如视频处理、训练方法、评估和提交流程。对于分类子任务,我们的v2模型达到了86.4%的准确率。对于检测子任务,我们的v1模型达到了0.131的平均精度均值(mAP)和0.515的交并比(IoU)。