2ヶ月前

COTR: 画像間の対応関係を求めるための変換器

Jiang, Wei ; Trulls, Eduard ; Hosang, Jan ; Tagliasacchi, Andrea ; Yi, Kwang Moo
COTR: 画像間の対応関係を求めるための変換器
要約

画像間の対応点を見つけるための新しいフレームワークを提案します。このフレームワークは、2つの画像とその内の1つの画像におけるクエリポイントが与えられた場合、他の画像における対応点を見つけ出す深層ニューラルネットワークに基づいています。これにより、興味のあるポイントのみをクエリし、疎な対応点を得るか、あるいは画像内のすべてのポイントをクエリし、濃密なマッピングを得ることが可能になります。重要なのは、局所的な事前知識と全体的な事前知識の両方を捉え、モデルが画像領域間の関連性を最も関連性の高い事前知識を使用して推定できるようにするために、当該ネットワークをトランスフォーマーで実現していることです。推論時には、推定値を中心に再帰的に拡大することでマルチスケールパイプラインを適用し、高精度な対応点を提供することが可能です。当手法は複数のデータセットやタスクにおいて広基線ステレオから光学フローまで、特定のデータセットに対する再学習なしに疎な対応点問題と濃密な対応点問題の両方で既存の最先端手法を大幅に上回ります。また、当研究ではデータやコードおよびゼロから学習するためのすべてのツールを公開することにコミットしており、再現性を確保します。

COTR: 画像間の対応関係を求めるための変換器 | 最新論文 | HyperAI超神経