11日前

ラインを視覚文として:視覚的局所化のための文脈認識型ライン記述子

Sungho Yoon, Ayoung Kim
ラインを視覚文として:視覚的局所化のための文脈認識型ライン記述子
要約

画像マッチングにおける特徴点に加えて、線分特徴量はロボティクスおよびコンピュータビジョン(CV)における視覚幾何問題の解法に追加の制約を提供する。近年、畳み込みニューラルネットワーク(CNN)に基づく線分記述子は、視点変化や動的環境に対しても有望であるが、本研究ではCNNアーキテクチャが可変長の線分を固定次元の記述子に抽象化する際に本質的な欠点を有すると主張する。本論文では、可変長線分を効果的に扱う「Line-Transformers」を提案する。自然言語処理(NLP)タスクにおいて、ニューラルネットワークが文を良好に理解・抽象化できる点に着想を得て、線分を点(単語)を含む「文」として捉える。線分上の記述に適した点に動的に注目することで、本記述子は可変長線分に対して優れた性能を発揮する。さらに、線分の幾何的属性を隣接領域と共有する「線分シグネチャネットワーク」も提案する。グループ記述子として機能することで、線分間の相対幾何構造を理解し、線分記述子の性能を向上させる。最終的に、提案する線分記述子およびマッチング手法を「Point and Line Localization(PL-Loc)」フレームワークに統合する。実験により、特徴点に基づく視覚的局所化性能が本研究の線分特徴量によって向上することを示した。また、ホモグラフィ推定および視覚的局所化の課題において、提案手法の有効性を検証した。

ラインを視覚文として:視覚的局所化のための文脈認識型ライン記述子 | 最新論文 | HyperAI超神経