15日前
ラーザーミックス:半教師付きLiDARセマンティックセグメンテーションのための手法
Lingdong Kong, Jiawei Ren, Liang Pan, Ziwei Liu

要約
LiDAR点群の密なラベル付けは高コストであるため、完全教師あり学習手法のスケーラビリティが制限されている。本研究では、LiDARセグメンテーションにおける未だ十分に探索されていない半教師あり学習(SSL)に着目する。我々の核心的なアイデアは、LiDAR点群が持つ強力な空間的ヒントを活用し、ラベルなしデータをより効果的に活用することにある。そこで、異なるLiDARスキャンから得られたレーザービームを混合する手法であるLaserMixを提案し、混合前後でモデルが一貫性があり信頼性の高い予測を出力するよう促す。本フレームワークには以下の3つの魅力的な特徴がある:1)汎用性:LaserMixはLiDAR表現(例:レンジビュー、ボクセル)に依存しないため、本SSLフレームワークは普遍的に適用可能である。2)統計的根拠:提案手法の適用可能性を理論的に詳細に分析し、その妥当性を裏付けている。3)有効性:nuScenes、SemanticKITTI、ScribbleKITTIといった代表的なLiDARセグメンテーションデータセットにおいて、包括的な実験分析を通じて本手法の有効性と優位性を実証した。特に、ラベル数を2倍から5倍削減した状態で、完全教師あり手法と同等の性能を達成し、また、教師ありのみのベースラインに対して平均で10.8%の大幅な向上を実現した。本研究では、簡潔でありながら高い性能を発揮するこのフレームワークが、今後の半教師ありLiDARセグメンテーション研究の発展に貢献することを期待している。コードは公開されている。