
摘要
在本工作中,我们提出了一种名为“切向图像”(tangent images)的球面图像表示方法,该方法有助于实现可迁移且可扩展的 $360^\circ$ 计算机视觉。受制图学与计算机图形学技术的启发,我们将球面图像投影到一组经过畸变校正、局部平面化的图像网格上,这些网格与细分后的二十面体在各个面处相切。通过独立调节这些网格的分辨率而不受细分层级的限制,我们能够在保持二十面体球面近似低畸变优势的同时,高效地表示高分辨率的球面图像。实验表明,在切向图像上训练标准卷积神经网络,其性能可与众多专门设计的球面卷积核相媲美,同时在处理更高球面分辨率时仍具备良好的可扩展性。此外,由于本方法无需依赖专用卷积核,我们进一步证明,可将仅在透视图像上训练的网络直接迁移至球面数据,无需微调,且性能下降有限。最后,我们展示了切向图像在提升球面图像中稀疏特征检测质量方面的有效性,充分体现了其在传统计算机视觉任务(如基于运动的结构重建与同步定位与地图构建,SLAM)中的实用价值。