17 天前

实时流式感知中的目标检测

Jinrong Yang, Songtao Liu, Zeming Li, Xiaoping Li, Jian Sun
实时流式感知中的目标检测
摘要

自动驾驶系统要求模型能够在低延迟条件下实时感知环境并作出响应,以保障安全。以往的研究往往忽略了在处理过程中环境发生的不可避免的变化,而流式感知(streaming perception)方法被提出,旨在将延迟与精度统一纳入一个综合指标中,以实现对视频在线感知的联合评估。本文不再像以往工作那样在精度与速度之间进行权衡搜索,而是指出:赋予实时模型预测未来的能力,才是应对该问题的关键。为此,我们构建了一个简洁而高效的流式感知框架,其中引入了一种新颖的双流感知模块(DualFlow Perception, DFP),该模块包含动态流与静态流,分别用于捕捉目标的运动趋势与基础检测特征,以支持流式预测。此外,我们设计了一种趋势感知损失函数(Trend-Aware Loss, TAL),结合趋势因子生成自适应权重,以差异化地处理不同运动速度的目标。实验结果表明,所提方法在Argoverse-HD数据集上取得了具有竞争力的性能,相较于强基线模型,平均精度(AP)提升了4.9%,充分验证了其有效性。相关代码将开源至:https://github.com/yancie-yjr/StreamYOLO。