8ヶ月前

畳み込みニューラルネットワーク

アプローチ／フレームワーク

コンピュータビジョン

Amar Ali-bey* Brahim Chaib-draa Philippe Giguère

概要

視覚的な場所認識において、環境条件や視点が異なる状況下で位置の画像を正確に識別し、マッチングすることは依然として大きな課題となっています。本論文では、普遍的な場所特有の属性を捉えるために設計された一連のグローバルクエリを学習する新しい手法、Bag-of-Queries (BoQ) を紹介します。既存の自己注意機構を使用して入力特徴から直接クエリを生成する方法とは異なり、BoQ は異なる学習可能なグローバルクエリを用いてクロスアテンションを通じて入力特徴を探査し、一貫した情報集約を確保します。さらに、当手法は解釈可能な注意メカニズムを提供し、CNN および Vision Transformer バックボーンと統合できます。BoQ の性能は14の大規模ベンチマークにおける広範な実験を通じて示されており、NetVLAD、MixVPR および EigenPlaces などの現行の最先端技術を一貫して上回っています。また、グローバル検索手法（ワンステージ）として、Patch-NetVLAD、TransVPR 及び R2Former などのツーステージ検索手法も大幅に上回り、その処理速度と効率性は桁違いです。コードとモデルの重みは https://github.com/amaralibey/Bag-of-Queries で公開されています。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

畳み込みニューラルネットワーク

アプローチ／フレームワーク

コンピュータビジョン

Amar Ali-bey* Brahim Chaib-draa Philippe Giguère

概要

視覚的な場所認識において、環境条件や視点が異なる状況下で位置の画像を正確に識別し、マッチングすることは依然として大きな課題となっています。本論文では、普遍的な場所特有の属性を捉えるために設計された一連のグローバルクエリを学習する新しい手法、Bag-of-Queries (BoQ) を紹介します。既存の自己注意機構を使用して入力特徴から直接クエリを生成する方法とは異なり、BoQ は異なる学習可能なグローバルクエリを用いてクロスアテンションを通じて入力特徴を探査し、一貫した情報集約を確保します。さらに、当手法は解釈可能な注意メカニズムを提供し、CNN および Vision Transformer バックボーンと統合できます。BoQ の性能は14の大規模ベンチマークにおける広範な実験を通じて示されており、NetVLAD、MixVPR および EigenPlaces などの現行の最先端技術を一貫して上回っています。また、グローバル検索手法（ワンステージ）として、Patch-NetVLAD、TransVPR 及び R2Former などのツーステージ検索手法も大幅に上回り、その処理速度と効率性は桁違いです。コードとモデルの重みは https://github.com/amaralibey/Bag-of-Queries で公開されています。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています