11日前

UniDet3D:マルチデータセット対応インテリア3Dオブジェクト検出

Maksim Kolodiazhnyi, Anna Vorontsova, Matvey Skripkin, Danila Rukhovich, Anton Konushin
UniDet3D:マルチデータセット対応インテリア3Dオブジェクト検出
要約

ロボット工学および拡張現実(AR)分野におけるスマートソリューションに対する顧客需要の拡大に伴い、点群からの3次元オブジェクト検出は注目を集めている。しかし、これまでに公開されている室内用データセットは個別に見ると規模が小さく、多様性に欠けており、強力で汎用性の高い3次元オブジェクト検出モデルの学習には不十分である。一方で、基礎モデル(foundation models)を活用するより一般的なアプローチは、特定タスクに特化した教師あり学習に基づく手法に比べて性能が劣っているのが現状である。本研究では、複数の室内データセットを混合して学習可能な、シンプルながら効果的な3次元オブジェクト検出モデル「UniDet3D」を提案する。本モデルは、さまざまな室内環境での運用が可能であり、異なるラベル空間を統一することで、教師付きの統合学習スキームにより複数のデータセット間で強力な表現を学習可能である。提案するネットワークアーキテクチャは、基本的なTransformerエンコーダに基づいて構築されており、実用的な用途に向けた予測パイプラインの実行・カスタマイズ・拡張が容易である。広範な実験により、6つの室内ベンチマーク(ScanNet:+1.1 mAP50、ARKitScenes:+19.4 mAP25、S3DIS:+9.1 mAP50、MultiScan:+9.3 mAP50、3RScan:+3.2 mAP50、ScanNet++:+2.7 mAP50)において、既存の3次元オブジェクト検出手法を顕著に上回ることを実証した。コードは以下のURLで公開されている:https://github.com/filapro/unidet3d

UniDet3D:マルチデータセット対応インテリア3Dオブジェクト検出 | 最新論文 | HyperAI超神経