6ヶ月前

オブジェクト追跡

ビデオ処理

コンピュータビジョン

Anirudh S Chakravarthy Won-Dong Jang Zudi Lin Donglai Wei Song Bai Hanspeter Pfister

概要

動画インスタンスセグメンテーションは、動画内のオブジェクトを検出・セグメンテーション・追跡することを目的としています。現在の手法は、画像レベルのセグメンテーションアルゴリズムを時間軸方向に拡張するアプローチを採用していますが、これにより時間的に一貫性のないマスクが生じます。本研究では、時間的安定性に起因するマスク品質の低下が性能のボトルネックであることを明らかにしました。この問題に着目し、欠落検出に起因する課題を緩和する動画インスタンスセグメンテーション手法を提案します。空間情報のみではこの問題を解決できないため、フレーム間のアテンションを活用して時間的文脈を捉えます。これにより、隣接フレームからのボックス予測を用いて、欠落したオブジェクトにネットワークが再び注目できるようになり、検出漏れを克服できます。本手法は、Mask R-CNNをバックボーンとして使用する従来の最先端手法を大きく上回り、YouTube-VISベンチマークにおいて36.0%のmAPを達成しました。さらに、本手法は完全にオンライン処理が可能であり、未来のフレームを必要としません。実装コードはGitHubにて公開されています：https://github.com/anirudh-chakravarthy/ObjProp。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

オブジェクト追跡

ビデオ処理

コンピュータビジョン

Anirudh S Chakravarthy Won-Dong Jang Zudi Lin Donglai Wei Song Bai Hanspeter Pfister

概要

動画インスタンスセグメンテーションは、動画内のオブジェクトを検出・セグメンテーション・追跡することを目的としています。現在の手法は、画像レベルのセグメンテーションアルゴリズムを時間軸方向に拡張するアプローチを採用していますが、これにより時間的に一貫性のないマスクが生じます。本研究では、時間的安定性に起因するマスク品質の低下が性能のボトルネックであることを明らかにしました。この問題に着目し、欠落検出に起因する課題を緩和する動画インスタンスセグメンテーション手法を提案します。空間情報のみではこの問題を解決できないため、フレーム間のアテンションを活用して時間的文脈を捉えます。これにより、隣接フレームからのボックス予測を用いて、欠落したオブジェクトにネットワークが再び注目できるようになり、検出漏れを克服できます。本手法は、Mask R-CNNをバックボーンとして使用する従来の最先端手法を大きく上回り、YouTube-VISベンチマークにおいて36.0%のmAPを達成しました。さらに、本手法は完全にオンライン処理が可能であり、未来のフレームを必要としません。実装コードはGitHubにて公開されています：https://github.com/anirudh-chakravarthy/ObjProp。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています