11 天前
TORNADO-Net:基于钻石型并联模块的多视角全变分语义分割
Martin Gerdzhev, Ryan Razani, Ehsan Taghavi, Bingbing Liu

摘要
点云语义分割是机器人与自动驾驶领域场景理解的关键技术之一。本文提出TORNADO-Net——一种用于三维激光雷达(LiDAR)点云语义分割的神经网络。该网络结合了多视角(鸟瞰图与距离图)投影特征提取方法,采用编码器-解码器结构的ResNet架构,并引入一种新颖的钻石上下文模块(diamond context block)。现有基于投影的方法通常未充分考虑邻近点往往属于同一类别的这一特性。为更有效地利用局部邻域信息并降低噪声预测,我们提出将全变差(Total Variation)、Lovasz-Softmax与加权交叉熵损失函数相结合的损失策略。此外,我们充分利用LiDAR数据具备360度视野的特点,并采用环形填充(circular padding)技术以增强空间连续性。实验结果表明,TORNADO-Net在SemanticKITTI数据集上取得了当前最先进的性能,并通过详尽的定量分析与消融实验验证了各模块的有效性。