7ヶ月前

ビデオ処理

コンピュータビジョン

コンピュータビジョン

HervÃ© JÃ©gou Rita Cucchiara Matthijs Douze Lorenzo Baraldi

概要

本論文では、動画の比較およびアライメントを実現する学習可能なアプローチを提案する。我々のアーキテクチャは、ニューラルネットワーク内における時系列マッチカーネルの構築と再考に基づいている。具体的には、フーリエ領域でパラメータ化された時間に敏感な類似度メトリクスに従い、2つのベクトル列間のスコアを最大化することで時系列アライメントを探索する新たな時系列層を提案する。この層は、局所化の精度と認識率の両方を考慮した三重損失（triplet loss）を最小化する時系列提案戦略により学習される。提案手法は、動画アライメント、コピー検出、イベント検索の各タスクにおいて評価された。比較的な設定下で、本手法は時系列動画アライメントおよび動画コピー検出のデータセットにおいて、従来の最先端技術を上回る性能を達成した。また、特定のイベント検索タスクにおいても、報告されている最高の結果を達成しつつ、動画の正確なアライメントを実現している。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

7ヶ月前

ビデオ処理

コンピュータビジョン

コンピュータビジョン

HervÃ© JÃ©gou Rita Cucchiara Matthijs Douze Lorenzo Baraldi

概要

本論文では、動画の比較およびアライメントを実現する学習可能なアプローチを提案する。我々のアーキテクチャは、ニューラルネットワーク内における時系列マッチカーネルの構築と再考に基づいている。具体的には、フーリエ領域でパラメータ化された時間に敏感な類似度メトリクスに従い、2つのベクトル列間のスコアを最大化することで時系列アライメントを探索する新たな時系列層を提案する。この層は、局所化の精度と認識率の両方を考慮した三重損失（triplet loss）を最小化する時系列提案戦略により学習される。提案手法は、動画アライメント、コピー検出、イベント検索の各タスクにおいて評価された。比較的な設定下で、本手法は時系列動画アライメントおよび動画コピー検出のデータセットにおいて、従来の最先端技術を上回る性能を達成した。また、特定のイベント検索タスクにおいても、報告されている最高の結果を達成しつつ、動画の正確なアライメントを実現している。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています