HyperAIHyperAI

Command Palette

Search for a command to run...

ビデオインスタンスセグメンテーション

Linjie Yang* ByteDance AI Lab [email protected] Yuchen Fan UIUC [email protected] Ning Xu Adobe Research [email protected]

概要

本論文では、新しいコンピュータビジョンの課題であるビデオインスタンスセグメンテーションを提案します。この新規課題の目的は、ビデオ内のインスタンスの検出、セグメンテーション、追跡を同時に実行することです。具体的には、画像インスタンスセグメンテーション問題が初めてビデオ領域に拡張されたものです。この新規課題に関する研究を促進するため、40カテゴリラベルセットと131,000枚の高品質なインスタンスマスクを含む2,883本の高解像度YouTubeビデオから構成される大規模ベンチマークデータセット「YouTube-VIS」を提案します。さらに、この課題向けに新しいアルゴリズム「MaskTrack R-CNN」を提案します。当社の新方法は、Mask R-CNNに新しい追跡ブランチを導入し、検出、セグメンテーション、追跡の各タスクを同時に共同で実行します。最後に、提案手法といくつかの強力なベースライン手法について新しいデータセット上で評価を行いました。実験結果は明確に提案アルゴリズムの優位性を示し、今後の改善への洞察も提供しています。私たちは、ビデオインスタンスセグメンテーションという課題がビデオ理解に関する研究分野でのコミュニティの活動を刺激すると信じています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
ビデオインスタンスセグメンテーション | 記事 | HyperAI超神経