7日前
視差マップを用いた幾何学的認識インスタンスセグメンテーション
Cho-Ying Wu, Xiaoyan Hu, Michael Happold, Qiangeng Xu, Ulrich Neumann

要約
これまでの外景画像におけるインスタンスセグメンテーションの多くは、カラー情報のみを用いていた。本研究では、ステレオカメラを活用する新しいセンサフュージョンアプローチを提案する。視差から得られる幾何情報により、同一クラスまたは異なるクラスの重複する物体を効果的に分離可能となる。さらに、不自然な3D形状を持つ領域提案に対して幾何情報がペナルティを課すことで、誤検出(偽陽性)を抑制することができる。マスク回帰は、擬似LiDAR表現と画像ベース表現を用いた2D、2.5D、3DのROIに基づいて実施され、これらのマスク予測はマスクスコアリングプロセスにより統合される。しかしながら、既存の公開データセットは、比較的短い基線距離および焦点距離を持つステレオシステムを採用しており、ステレオカメラの測定距離に制限が生じている。本研究では、より長い基線距離および焦点距離、かつ高解像度を備えた高品質ドライブステレオ(High-Quality Driving Stereo: HQDS)データセットを収集・活用した。これにより、最先端の性能を達成した。詳細はプロジェクトページをご参照ください。論文全文は以下のリンクから入手可能である。