2ヶ月前
IAM: 新規ベンチマークを用いたRGB-Dインスタンスセグメンテーションの向上
Jung, Aecheon ; Choi, Soyun ; Min, Junhong ; Hong, Sungeun

要約
画像セグメンテーションは、日常生活における人的支援の提供と自律性の向上に重要な役割を果たします。特に、視覚情報と深度情報を両方活用するRGB-Dセグメンテーションは、RGBのみの手法よりも豊かなシーン理解を約束しているため、注目を集めています。しかし、既存の多くの研究は主に意味セグメンテーションに焦点を当てており、個体レベルのRGB-Dセグメンテーションデータセットが相対的に少ないという重要なギャップが残されています。これにより、現在の手法は広範なカテゴリの区別に留まり、個々の物体を認識するために必要な細かい詳細を完全に捉えることができません。このギャップを埋めるために、我々は3つのRGB-D個体セグメンテーションベンチマークを導入します。これらのデータセットは個体レベルで区別されており、室内ナビゲーションからロボット操作まで幅広いアプリケーションをサポートしています。さらに、これらのベンチマーク上で様々なベースラインモデルの包括的な評価を行いました。この総合的な分析では、各モデルの強みと弱点が明らかになり、将来の研究がより堅牢で汎化性のある解決策へと進むための指針となっています。最後に、我々は単純ながら効果的なRGB-Dデータ統合方法を提案します。広範な評価結果は、我々のアプローチが有効であることを確認しており、より洗練されたシーン理解を目指す堅牢なフレームワークを提供しています。