6ヶ月前

ディープラーニング

コンピュータビジョン

アプローチ／フレームワーク

コンピュータビジョン

Qinglin Liu Xiaoqian Lv Quanling Meng Zonglin Li Xiangyuan Lan Shuo Yang Shengping Zhang Liqiang Nie

概要

従来の研究では、マッティング性能の向上に向けた文脈情報の重要性が強調されてきた。その結果、深層学習に基づくマッティング手法は、優れた結果を達成するため、プーリングや類似度に基づく文脈集約モジュールの設計に注力してきた。しかし、これらのモジュールは、学習時と推論時の画像サイズの違いによって生じる文脈スケールのシフトに対応できず、結果としてマッティング性能の低下を引き起こすことがある。本論文では、マッティングネットワークの文脈集約メカニズムを再検討したところ、文脈集約モジュールを一切搭載しない基本的なエンコーダ・デコーダネットワークが、実際にはより汎用的な文脈集約を学習でき、既存手法と比較して高いマッティング性能を達成できることを発見した。この知見を基に、シンプルでありながら非常に効果的なマッティングネットワーク「AEMatter」を提案する。AEMatterは、外観強化型軸方向学習（AEAL）ブロックを搭載したハイブリッドトランスフォーマー基盤を採用し、強力な文脈集約学習能力を持つ基本ネットワークを構築している。さらに、大規模画像を用いた学習戦略を活用することで、ネットワークがデータから文脈集約を効果的に学習できるように支援している。5つの代表的なマッティングデータセットにおける広範な実験により、提案手法AEMatterが最先端のマッティング手法を大きく上回ることを示した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

ディープラーニング

コンピュータビジョン

アプローチ／フレームワーク

コンピュータビジョン

Qinglin Liu Xiaoqian Lv Quanling Meng Zonglin Li Xiangyuan Lan Shuo Yang Shengping Zhang Liqiang Nie

概要

従来の研究では、マッティング性能の向上に向けた文脈情報の重要性が強調されてきた。その結果、深層学習に基づくマッティング手法は、優れた結果を達成するため、プーリングや類似度に基づく文脈集約モジュールの設計に注力してきた。しかし、これらのモジュールは、学習時と推論時の画像サイズの違いによって生じる文脈スケールのシフトに対応できず、結果としてマッティング性能の低下を引き起こすことがある。本論文では、マッティングネットワークの文脈集約メカニズムを再検討したところ、文脈集約モジュールを一切搭載しない基本的なエンコーダ・デコーダネットワークが、実際にはより汎用的な文脈集約を学習でき、既存手法と比較して高いマッティング性能を達成できることを発見した。この知見を基に、シンプルでありながら非常に効果的なマッティングネットワーク「AEMatter」を提案する。AEMatterは、外観強化型軸方向学習（AEAL）ブロックを搭載したハイブリッドトランスフォーマー基盤を採用し、強力な文脈集約学習能力を持つ基本ネットワークを構築している。さらに、大規模画像を用いた学習戦略を活用することで、ネットワークがデータから文脈集約を効果的に学習できるように支援している。5つの代表的なマッティングデータセットにおける広範な実験により、提案手法AEMatterが最先端のマッティング手法を大きく上回ることを示した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています