
摘要
驾驶员能够识别交通指挥人员的手势并作出相应反应,但自动驾驶车辆通常无法做到这一点,除非其具备道路交通指挥手势识别功能。本文针对现有自动驾驶数据集在交通指挥手势识别学习数据方面的不足,提出了一种新的解决方案。我们构建了一个基于三维人体骨骼信息输入的数据集,能够在每一时间步对交通指挥手势进行分类。该数据集包含来自多位演员的250段序列,每段序列时长介于16至90秒之间。为评估该数据集的有效性,我们设计了八种基于深度神经网络的序列化处理模型,涵盖循环神经网络(RNN)、注意力机制、时序卷积网络(TCN)以及图卷积网络(GCN)等方法。本文对所有方法在该数据集上的表现进行了全面的评估与分析,并进一步开展了真实场景下的定量评估。相关代码与数据集均已公开发布,可供学术界与工业界研究使用。