DVIS-DAQ: تحسين تقسيم الفيديو من خلال استعلامات الأناقة الديناميكية

تستخدم طرق الفصل الحديثة في الفيديو استعلامات الأشياء لإجراء الارتباط بين الإطارات وتظهر أداءً مرضيًا في تتبع الأشياء التي تظهر بشكل مستمر رغم الحركة على نطاق واسع والاخفاء المؤقت. ومع ذلك، فإن جميع هذه الطرق تتفوق بأداء ضعيف عند التعامل مع الأشياء الجديدة التي تظهر وتختفي، وهي ظواهر شائعة في العالم الحقيقي، لأنها تحاول نمذجة ظهور واختفاء الأشياء من خلال انتقالات الخصائص بين استعلامات الخلفية والForground (المقدمة) التي لديها فجوات خصائص كبيرة.للتغلب على هذا التحدي، نقدم استعلامات الركائز الديناميكية (Dynamic Anchor Queries - DAQ) لتقليل الفجوة في الانتقال بين استعلامات الركائز والأهداف من خلال توليد استعلامات ركائز ديناميكياً بناءً على خصائص المرشحين المحتملين. بالإضافة إلى ذلك، نقدم استراتيجية محاكاة ظهور واختفاء الأشياء على مستوى الاستعلام (Emergence and Disappearance Simulation - EDS)، والتي تعزز إمكانات DAQ دون أي تكلفة إضافية. وأخيرًا، ندمج DAQ وEDS المقترحين مع DVIS للحصول على DVIS-DAQ. أثبتت التجارب الواسعة أن DVIS-DAQ يحقق أداءً جديدًا يفوق ما سبقه (state-of-the-art - SOTA) في خمسة مقاييس رئيسية لفصل الفيديو. يمكن الحصول على الكود والنماذج من \url{https://github.com/SkyworkAI/DAQ-VS}.