
摘要
高精度、轻量化和实时响应是实现自动驾驶的三个基本要求。在本研究中,我们引入了A-YOLOM,这是一种自适应、实时且轻量化的多任务模型,旨在同时解决目标检测、可行驶区域分割和车道线分割任务。具体而言,我们开发了一种端到端的多任务模型,具有统一且简化的分割结构。我们引入了一个可学习的参数,该参数在分割任务中自适应地连接颈部和主干之间的特征,并为所有分割任务使用相同的损失函数。这消除了对定制化的需求,增强了模型的泛化能力。此外,我们设计了一个仅由一系列卷积层组成的分割头,从而减少了参数数量和推理时间。我们在BDD100k数据集上取得了有竞争力的结果,特别是在可视化效果方面。性能结果显示,目标检测的mAP50为81.1%,可行驶区域分割的mIoU为91.0%,车道线分割的IoU为28.8%。此外,我们还引入了现实场景来评估模型在实际环境中的表现,结果显著优于竞争对手。这表明我们的模型不仅表现出有竞争力的性能,而且比现有的多任务模型更加灵活和快速。源代码和预训练模型已发布在https://github.com/JiayuanWang-JW/YOLOv8-multi-task。