6ヶ月前

ビデオ理解

セマンティックセグメンテーション

オブジェクト追跡

コンピュータビジョン

Jintu Zheng Yun Liang Yuqing Zhang Wanchao Su

概要

メモリベースの動画オブジェクトセグメンテーション手法は、メモリバンクを構築することで、長時間・大空間スケールにわたって複数のオブジェクトをモデル化し、顕著な性能を達成している。しかし、これらの手法は誤ったマッチングを克服しきれず、重要な情報を失いがちであり、結果として異なるオブジェクト間で混同が生じる問題を抱えている。本論文では、マッチング段階とデコード段階を統合的に改善することで、誤マッチング問題を緩和する有効なアプローチを提案する。マッチング段階においては、短期間メモリに対してわずかな誤差を抑制するコスト意識型メカニズムと、長期メモリに対してスケール間クロスマッチングを導入し、異なるオブジェクトスケールに対応可能な広範囲のマッチング空間を構築する。デコード段階では、マッチング段階で情報が欠落した場合にその本質的な情報を回復することを目的とした補償メカニズムを実装している。本手法は、代表的な複数ベンチマークにおいて優れた性能を達成しており、DAVIS 2016＆2017 Val（92.4％＆88.1％）、DAVIS 2017 Test（83.9％）、YouTubeVOS 2018＆2019 Val（84.8％＆84.6％）において高いスコアを記録した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

ビデオ理解

セマンティックセグメンテーション

オブジェクト追跡

コンピュータビジョン

Jintu Zheng Yun Liang Yuqing Zhang Wanchao Su

概要

メモリベースの動画オブジェクトセグメンテーション手法は、メモリバンクを構築することで、長時間・大空間スケールにわたって複数のオブジェクトをモデル化し、顕著な性能を達成している。しかし、これらの手法は誤ったマッチングを克服しきれず、重要な情報を失いがちであり、結果として異なるオブジェクト間で混同が生じる問題を抱えている。本論文では、マッチング段階とデコード段階を統合的に改善することで、誤マッチング問題を緩和する有効なアプローチを提案する。マッチング段階においては、短期間メモリに対してわずかな誤差を抑制するコスト意識型メカニズムと、長期メモリに対してスケール間クロスマッチングを導入し、異なるオブジェクトスケールに対応可能な広範囲のマッチング空間を構築する。デコード段階では、マッチング段階で情報が欠落した場合にその本質的な情報を回復することを目的とした補償メカニズムを実装している。本手法は、代表的な複数ベンチマークにおいて優れた性能を達成しており、DAVIS 2016＆2017 Val（92.4％＆88.1％）、DAVIS 2017 Test（83.9％）、YouTubeVOS 2018＆2019 Val（84.8％＆84.6％）において高いスコアを記録した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

メモリマッチングだけでは不十分：ビデオオブジェクトセグメンテーションにおけるメモリマッチングとデコードの共同最適化 | 記事 | HyperAI超神経