17 天前
AZTR:基于自动缩放与时间推理的空中视频动作识别
Xijun Wang, Ruiqi Xian, Tianrui Guan, Celso M. de Melo, Stephen M. Nogar, Aniket Bera, Dinesh Manocha

摘要
我们提出了一种面向无人机航拍视频动作识别的新型方法。该方法专为无人机(UAV)拍摄的视频设计,可在边缘设备或移动终端上高效运行。我们提出了一种基于学习的解决方案,采用定制化的自动变焦技术,能够自动检测人体目标并将其缩放到合适的尺度,从而更易于提取关键特征,同时显著降低计算开销。此外,我们还设计了一种高效的时序推理算法,可在可控的计算成本下,有效捕捉空间与时间维度上的动作信息。所提方法已在桌面端(配备高端GPU)以及低功耗的机器人RB5平台(适用于机器人与无人机)上实现并完成评估。实验结果表明,在RoCoG-v2数据集上,我们的方法在Top-1准确率上相较当前最优(SOTA)方法提升了6.1%至7.4%;在UAV-Human数据集上提升8.3%至10.4%;在Drone Action数据集上提升3.2%,验证了该方法在实际应用中的优越性能与高效性。