13 天前
(AF)²-S3Net:用于稀疏语义分割网络的注意力特征融合与自适应特征选择
Ran Cheng, Ryan Razani, Ehsan Taghavi, Enxu Li, Bingbing Liu

摘要
自主机器人系统与自动驾驶汽车依赖于对周围环境的精确感知,因为乘客与行人的安全始终是首要考虑因素。语义分割是环境感知中的关键组成部分,能够提供场景的语义信息。近年来,针对三维激光雷达(3D LiDAR)语义分割已提出多种方法。然而,这些方法在提升性能的同时,往往面临计算复杂度高导致效率低下,或难以捕捉小目标实例的精细细节等问题。为缓解上述挑战,本文提出AF2-S3Net——一种面向3D LiDAR语义分割的端到端编码器-解码器卷积神经网络。我们在编码器中设计了一种新型多分支注意力特征融合模块,在解码器中引入一种独特的自适应特征选择模块,并结合特征图重加权机制。AF2-S3Net将体素(voxel)学习与点云(point-based)学习有效融合于统一框架中,从而高效处理大规模三维场景。实验结果表明,所提方法在大规模SemanticKITTI基准测试中优于现有最先进方法,在论文发表时位居公开排行榜第一名。