6ヶ月前

コンピュータビジョン

セマンティックセグメンテーション

オブジェクト追跡

コンピュータビジョン

Tianfei Zhou Shunzhou Wang Yi Zhou Yazhou Yao Jianwu Li Ling Shao

概要

本稿では、ゼロショット動画オブジェクトセグメンテーションのための新たな手法として、運動情報を利用した空間時系列的オブジェクト表現の強化を可能にする「モーション・アテンション遷移ネットワーク（MATNet）」を提案する。本手法では、二重ストリームエンコーダ内に、非対称なアテンションブロックである「モーション・アテンション遷移（MAT）」を設計し、各畳み込み段階において外観特徴を運動に敏感な表現に変換する。これにより、エンコーダ内部に深く相互に絡み合う構造が実現され、オブジェクトの運動と外観の階層的かつ密接な相互作用が可能となる。これは従来の二重ストリームアーキテクチャと比較して優れている。従来手法は各ストリームで運動情報と外観情報を別々に処理するため、外観情報に過剰にフィットしやすく、一般化性能が低下する傾向がある。さらに、多段階エンコーダ特徴に対してコンパクトで識別力が高く、スケールに敏感な表現を得るためのブリッジネットワークを提案し、その出力をデコーダに供給することでセグメンテーション結果を生成する。DAVIS-16、FBMS、Youtube-Objectsの3つの難易度の高い公開ベンチマークにおける広範な実験結果から、本モデルが最先端手法と比較して優れた性能を発揮することが示された。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

コンピュータビジョン

セマンティックセグメンテーション

オブジェクト追跡

コンピュータビジョン

Tianfei Zhou Shunzhou Wang Yi Zhou Yazhou Yao Jianwu Li Ling Shao

概要

本稿では、ゼロショット動画オブジェクトセグメンテーションのための新たな手法として、運動情報を利用した空間時系列的オブジェクト表現の強化を可能にする「モーション・アテンション遷移ネットワーク（MATNet）」を提案する。本手法では、二重ストリームエンコーダ内に、非対称なアテンションブロックである「モーション・アテンション遷移（MAT）」を設計し、各畳み込み段階において外観特徴を運動に敏感な表現に変換する。これにより、エンコーダ内部に深く相互に絡み合う構造が実現され、オブジェクトの運動と外観の階層的かつ密接な相互作用が可能となる。これは従来の二重ストリームアーキテクチャと比較して優れている。従来手法は各ストリームで運動情報と外観情報を別々に処理するため、外観情報に過剰にフィットしやすく、一般化性能が低下する傾向がある。さらに、多段階エンコーダ特徴に対してコンパクトで識別力が高く、スケールに敏感な表現を得るためのブリッジネットワークを提案し、その出力をデコーダに供給することでセグメンテーション結果を生成する。DAVIS-16、FBMS、Youtube-Objectsの3つの難易度の高い公開ベンチマークにおける広範な実験結果から、本モデルが最先端手法と比較して優れた性能を発揮することが示された。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

ゼロショット動画オブジェクトセグメンテーションのためのモーションアテンション遷移 | 記事 | HyperAI超神経