Command Palette
Search for a command to run...
エッジ認識型3Dインスタンスセグメンテーションネットワークと知能型意味的プライアリ
エッジ認識型3Dインスタンスセグメンテーションネットワークと知能型意味的プライアリ
Sangpil Kim Sang Ho Yoon Hyunje Park Jinseop Yeom Giljoo Nam Hwanhee Jung Wonseok Roh
概要
近年の3Dインスタンスセグメンテーション手法は、トランスフォーマー構造を基盤として有望な成果を上げているが、外観が類似するインスタンスを正しく識別できない問題や、境界領域の曖昧な判定により隣接する境界点が複数の誤分類を引き起こすといった課題を抱えている。本研究では、こうした課題を克服し、複雑な3Dインスタンスの認識性能を向上させるため、新しいフレームワーク「EASE」を提案する。まず、言語モデルから得られる豊富な意味的知識を活用し、幾何学的情報に依存するだけではなく、現実世界のインスタンスに対する機能的理解を強化する知的な事前知識(インテリジェント・プライア)として用いる「意味的ガイドネットワーク」を提案する。さらに、各インスタンスのテキスト埋め込み(text embeddings)を用いて基本的なインスタンスクエリを明示的に指示することで、深層的な意味的特徴を学習可能にする。また、境界予測モジュールを導入し、セグメンテーションネットワークが境界に敏感になるように促進する。点群特徴からボクセル単位の境界マップを抽出し、これを補助情報として境界の手がかりを学習するための役割に活用する。大規模ベンチマークであるScanNetV2、ScanNet200、S3DIS、STPLS3Dにおける広範な実験結果から、EASEが既存の最先端モデルを上回る優れた性能を示すことが明らかになった。