
摘要
语义分割(Semantic Segmentation, SS)在自动驾驶、辅助导航等安全关键应用中的室外场景感知方面展现出巨大潜力。然而,传统的语义分割主要依赖于RGB图像,这在复杂室外场景中限制了其可靠性,因为RGB图像缺乏足够的信息维度,难以充分感知非受限环境。作为初步探索,我们针对意外障碍物检测这一场景开展研究,结果表明多模态融合的必要性。为此,本文提出EAFNet——一种高效注意力桥接融合网络(Efficient Attention-bridged Fusion Network),旨在充分利用来自不同光学传感器的互补信息。具体而言,我们引入偏振感知技术以获取补充信息,考虑到其在表征多样化材料时所具备的光学优势。通过使用单次采集的偏振传感器,我们构建了首个RGB-P数据集,包含394张像素级对齐的RGB-偏振图像,并进行了标注。大量全面的实验验证了EAFNet在融合偏振与RGB信息方面的有效性,同时也证明了其在适配其他传感器组合场景时的灵活性。