8ヶ月前

ビデオ理解

セマンティックセグメンテーション

オブジェクト追跡

コンピュータビジョン

Zhihui Lin Tianyu Yang Maomao Li Ziyu Wang Chun Yuan Wenhao Jiang Wei Liu

概要

マッチングベースの手法、特に時空記憶に基づく手法は、半教師付きビデオオブジェクトセグメンテーション（VOS）において他のソリューションを大きく上回っています。しかし、継続的に増加し冗長となるテンプレート特徴量は推論効率を低下させています。この問題を緩和するため、我々は新しいシーケンシャルウェイテッド期待最大化（SWEM）ネットワークを提案します。これはメモリ特徴量の冗長性を大幅に削減することを目指しています。既存の手法がフレーム間での特徴量の冗長性のみを検出するのに対し、SWEMは逐次ウェイテッドEMアルゴリズムを利用してフレーム内およびフレーム間の類似した特徴量を統合します。さらに、フレーム特徴量に対する適応的な重み付けにより、SWEMは難易度の高いサンプルを表現する柔軟性を持ち、テンプレートの識別力を向上させます。また、提案手法はメモリ内のテンプレート特徴量数を一定に保つことで、VOSシステムの推論複雑さを安定させることが可能です。DAVISやYouTube-VOSなどの一般的なデータセットにおける広範な実験により、SWEMの高い効率性（36 FPS）と高性能（DAVIS 2017検証データセットで84.3% $\mathcal{J}\&\mathcal{F}$ ）が確認されました。コードは以下のURLから入手可能です: https://github.com/lmm077/SWEM.

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

ビデオ理解

セマンティックセグメンテーション

オブジェクト追跡

コンピュータビジョン

Zhihui Lin Tianyu Yang Maomao Li Ziyu Wang Chun Yuan Wenhao Jiang Wei Liu

概要

マッチングベースの手法、特に時空記憶に基づく手法は、半教師付きビデオオブジェクトセグメンテーション（VOS）において他のソリューションを大きく上回っています。しかし、継続的に増加し冗長となるテンプレート特徴量は推論効率を低下させています。この問題を緩和するため、我々は新しいシーケンシャルウェイテッド期待最大化（SWEM）ネットワークを提案します。これはメモリ特徴量の冗長性を大幅に削減することを目指しています。既存の手法がフレーム間での特徴量の冗長性のみを検出するのに対し、SWEMは逐次ウェイテッドEMアルゴリズムを利用してフレーム内およびフレーム間の類似した特徴量を統合します。さらに、フレーム特徴量に対する適応的な重み付けにより、SWEMは難易度の高いサンプルを表現する柔軟性を持ち、テンプレートの識別力を向上させます。また、提案手法はメモリ内のテンプレート特徴量数を一定に保つことで、VOSシステムの推論複雑さを安定させることが可能です。DAVISやYouTube-VOSなどの一般的なデータセットにおける広範な実験により、SWEMの高い効率性（36 FPS）と高性能（DAVIS 2017検証データセットで84.3% $\mathcal{J}\&\mathcal{F}$ ）が確認されました。コードは以下のURLから入手可能です: https://github.com/lmm077/SWEM.

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています