2ヶ月前
DVIS-DAQ: 動的アンカークエリを用いたビデオセグメンテーションの改善
Yikang Zhou; Tao Zhang; Shunping Ji; Shuicheng Yan; Xiangtai Li

要約
現代のビデオセグメンテーション手法は、オブジェクトクエリを採用してフレーム間の関連付けを行い、大規模な動きや一時的な遮蔽がある場合でも継続的に現れる物体の追跡において満足できる性能を示しています。しかし、現実世界で一般的に見られる新規出現と消失する物体については、パフォーマンスが低下します。これは、背景クエリと前景クエリ間の特徴遷移を通じて物体の出現と消失をモデル化しようとするためで、これらのクエリ間に大きな特徴ギャップがあるからです。本研究では、潜在的な候補の特徴に基づいて動的にアンカークエリを生成することで、アンカークエリとターゲットクエリ間の遷移ギャップを短縮するDynamic Anchor Queries(DAQ)を提案します。さらに、追加コストなしでDAQの潜在能力を引き出すために、クエリレベルでの物体出現・消失シミュレーション(EDS)戦略も導入します。最後に、提案したDAQとEDSをDVISに組み合わせてDVIS-DAQを開発しました。広範な実験により、DVIS-DAQは5つの主要なビデオセグメンテーションベンチマークにおいて新たな最先端(SOTA)性能を達成することが確認されました。コードおよびモデルは\url{https://github.com/SkyworkAI/DAQ-VS}から入手可能です。