11日前
(AF)²-S3Net:スパースセマンティックセグメンテーションネットワークにおける注意型特徴融合と適応的特徴選択
Ran Cheng, Ryan Razani, Ehsan Taghavi, Enxu Li, Bingbing Liu

要約
自律型ロボットシステムおよび自動運転車は、乗客および歩行者の安全を最優先事項とするため、周囲環境を正確に認識する能力に依存しています。環境認識における重要な要素の一つとして、セマンティックセグメンテーションがあり、これはシーンの意味情報を提供します。近年、3D LiDARを用いたセマンティックセグメンテーションに関する複数の手法が提案されています。しかし、これらの手法は性能向上をもたらす一方で、計算量が非常に高いため効率が悪く、あるいは小さなインスタンスの詳細情報を十分に捉えられないという課題を抱えています。この問題を軽減するため、本研究では、3D LiDARセマンティックセグメンテーションを対象としたエンドツーエンドのエンコーダ・デコーダ型CNNネットワーク「AF2-S3Net」を提案します。エンコーダ部には、新たなマルチブランチアテンション特徴融合モジュールを導入し、デコーダ部には特徴マップの再重み付けを実現する独自の適応的特徴選択モジュールを設計しました。AF2-S3Netは、ボクセルベース学習とポイントベース学習を統合した単一のフレームワークとして構築することで、大規模な3Dシーンを効果的に処理可能です。実験結果から、提案手法は大規模なSemanticKITTIベンチマークにおいて、最先端の手法を上回る性能を発揮し、公開リーダーボードコンペティションにおいて本論文発表時点で1位を獲得しました。