
摘要
准确而快速的场景理解是自动驾驶领域的一项挑战性任务,需要充分利用激光雷达点云进行语义分割。在本文中,我们提出了一种简洁高效的基于图像的语义分割网络,命名为CENet。为了提高学习特征的描述能力并减少计算和时间复杂度,我们的CENet在网络架构中集成了大核卷积(而不是多层感知机MLP)、精心选择的激活函数以及多个带有相应损失函数的辅助分割头。我们在公开可用的数据集SemanticKITTI和SemanticPOSS上进行了定量和定性实验,结果表明我们的方法在mIoU和推理性能方面均优于现有最先进模型。代码将在https://github.com/huixiancheng/CENet 上提供。