HyperAIHyperAI
منذ 11 أيام

تتبع الكائنات المتعددة كتنبؤ بالهوية

Ruopeng Gao, Ji Qi, Limin Wang
تتبع الكائنات المتعددة كتنبؤ بالهوية
الملخص

يُعد تتبع الكائنات المتعددة (MOT) تحديًا قائمًا منذ فترة طويلة في فهم الفيديو. يُعد النهج الطبيعي والواضح هو تقسيم هذه المهمة إلى جزأين: الكشف عن الكائنات والربط بينها. تعتمد معظم الطرق الشائعة على تقنيات حسابية مُعدّة بعناية للحفاظ على معلومات المسار وحساب مصفوفات التكلفة لربط الكائنات. وعلى الرغم من أن هذه الطرق تحقق أداءً متميزًا في التتبع، إلا أنها غالبًا ما تتطلب سلسلة من التعديلات المُصممة يدويًا، وتقف عاجزة أمام السيناريوهات المعقدة. نحن نعتقد أن الافتراضات الأولية المُحددة يدويًا تحد من قدرة الطريقة على التكيّف والمرونة في تعلّم القدرات المثلى للتعقب من البيانات المُحددة للنطاق. لذلك، نقدّم منظورًا جديدًا يُعامل تتبع الكائنات المتعددة كمهمة تنبؤ بالهوية في السياق (in-context ID Prediction)، وتحويل عملية الربط بين الكائنات المذكورة سابقًا إلى مهمة قابلة للتدريب من النهاية إلى النهاية. بناءً على هذا، نُقدّم طريقة بسيطة وفعّالة تُسمّى MOTIP. وباستخدام مجموعة من المسارات التي تحمل معلومات الهوية، تقوم MOTIP بفك تشفير تسميات الهوية للكشفات الحالية مباشرةً، بهدف إنجاز عملية الربط. وبلا استخدام هياكل مُصممة خصيصًا أو معقدة، تحقق طريقة我们的 نتائج رائدة في مجال الأداء عبر عدة معايير، وذلك باستخدام ميزات على مستوى الكائنات فقط كمؤشرات للتتبع. وبساطة الطريقة ونتائجها المُبهرة تترك مجالًا واسعًا للتطورات المستقبلية، مما يجعلها قاعدة مُبشرة للبحث اللاحق. تم إصدار الشفرة والنقاط المُسجّلة على الرابط التالي: https://github.com/MCG-NJU/MOTIP.

تتبع الكائنات المتعددة كتنبؤ بالهوية | أحدث الأوراق البحثية | HyperAI