17日前

画像マッティングにおけるコンテキスト集約の再検討

Qinglin Liu, Xiaoqian Lv, Quanling Meng, Zonglin Li, Xiangyuan Lan, Shuo Yang, Shengping Zhang, Liqiang Nie
画像マッティングにおけるコンテキスト集約の再検討
要約

従来の研究では、マッティング性能の向上に向けた文脈情報の重要性が強調されてきた。その結果、深層学習に基づくマッティング手法は、優れた結果を達成するため、プーリングや類似度に基づく文脈集約モジュールの設計に注力してきた。しかし、これらのモジュールは、学習時と推論時の画像サイズの違いによって生じる文脈スケールのシフトに対応できず、結果としてマッティング性能の低下を引き起こすことがある。本論文では、マッティングネットワークの文脈集約メカニズムを再検討したところ、文脈集約モジュールを一切搭載しない基本的なエンコーダ・デコーダネットワークが、実際にはより汎用的な文脈集約を学習でき、既存手法と比較して高いマッティング性能を達成できることを発見した。この知見を基に、シンプルでありながら非常に効果的なマッティングネットワーク「AEMatter」を提案する。AEMatterは、外観強化型軸方向学習(AEAL)ブロックを搭載したハイブリッドトランスフォーマー基盤を採用し、強力な文脈集約学習能力を持つ基本ネットワークを構築している。さらに、大規模画像を用いた学習戦略を活用することで、ネットワークがデータから文脈集約を効果的に学習できるように支援している。5つの代表的なマッティングデータセットにおける広範な実験により、提案手法AEMatterが最先端のマッティング手法を大きく上回ることを示した。

画像マッティングにおけるコンテキスト集約の再検討 | 最新論文 | HyperAI超神経