11日前

GMTR:グラフマッチングトランスフォーマー

Jinpei Guo, Shaofeng Zhang, Runzhong Wang, Chang Liu, Junchi Yan
GMTR:グラフマッチングトランスフォーマー
要約

最近、視覚変換器(Vision Transformers, ViTs)は物体検出やセグメンテーションを越えて、視覚的マッチングの分野でも活用されている。しかし、ViTの元々のグリッド分割戦略はキーポイントの空間情報を無視するため、局所情報に対する感受性に制限がある。そこで本研究では、クロスアテンションモジュールとキーポイントに基づくセンタークロップ戦略を採用したQueryTrans(Query Transformer)を提案する。さらに、グラフアテンションモジュールを統合し、グラフ変換器ニューラルマッチングソルバーにより組み合わせ的性質を持つグラフマッチング(GM)問題を効果的に扱うTransformerベースのグラフマッチング手法GMTR(Graph Matching TRansformers)を構築した。標準的なGMベンチマークにおいて、GMTRは最先端(SOTA)フレームワークと比較して競争力のある性能を示した。具体的には、Pascal VOCでは83.6%の精度を達成し、SOTAフレームワークより0.9%高い結果を記録した。Spair-71kでは大きな潜在能力を示し、既存の多くの手法を上回った。一方、Pascal VOCにおいてQueryTransはNGMv2の精度を80.1%から83.3%へ、BBGMは79.0%から84.5%へ向上させた。Spair-71kでは、NGMv2が80.6%から82.5%、BBGMが82.1%から83.9%へ改善された。ソースコードは公開予定である。

GMTR:グラフマッチングトランスフォーマー | 最新論文 | HyperAI超神経