HyperAIHyperAI

Command Palette

Search for a command to run...

تتبع الكائنات المتعددة كتنبؤ بالهوية

Ruopeng Gao Ji Qi Limin Wang

الملخص

يُعد تتبع الكائنات المتعددة (MOT) تحديًا قائمًا منذ فترة طويلة في فهم الفيديو. يُعد النهج الطبيعي والواضح هو تقسيم هذه المهمة إلى جزأين: الكشف عن الكائنات والربط بينها. تعتمد معظم الطرق الشائعة على تقنيات حسابية مُعدّة بعناية للحفاظ على معلومات المسار وحساب مصفوفات التكلفة لربط الكائنات. وعلى الرغم من أن هذه الطرق تحقق أداءً متميزًا في التتبع، إلا أنها غالبًا ما تتطلب سلسلة من التعديلات المُصممة يدويًا، وتقف عاجزة أمام السيناريوهات المعقدة. نحن نعتقد أن الافتراضات الأولية المُحددة يدويًا تحد من قدرة الطريقة على التكيّف والمرونة في تعلّم القدرات المثلى للتعقب من البيانات المُحددة للنطاق. لذلك، نقدّم منظورًا جديدًا يُعامل تتبع الكائنات المتعددة كمهمة تنبؤ بالهوية في السياق (in-context ID Prediction)، وتحويل عملية الربط بين الكائنات المذكورة سابقًا إلى مهمة قابلة للتدريب من النهاية إلى النهاية. بناءً على هذا، نُقدّم طريقة بسيطة وفعّالة تُسمّى MOTIP. وباستخدام مجموعة من المسارات التي تحمل معلومات الهوية، تقوم MOTIP بفك تشفير تسميات الهوية للكشفات الحالية مباشرةً، بهدف إنجاز عملية الربط. وبلا استخدام هياكل مُصممة خصيصًا أو معقدة، تحقق طريقة我们的 نتائج رائدة في مجال الأداء عبر عدة معايير، وذلك باستخدام ميزات على مستوى الكائنات فقط كمؤشرات للتتبع. وبساطة الطريقة ونتائجها المُبهرة تترك مجالًا واسعًا للتطورات المستقبلية، مما يجعلها قاعدة مُبشرة للبحث اللاحق. تم إصدار الشفرة والنقاط المُسجّلة على الرابط التالي: https://github.com/MCG-NJU/MOTIP.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp