HyperAIHyperAI

Command Palette

Search for a command to run...

TrackFormer: التتبع متعدد الكائنات باستخدام المحولات

Tim Meinhardt Alexander Kirillov Laura Leal-Taixe Christoph Feichtenhofer

الملخص

إن المهمة الصعبة لتتبع الكائنات المتعددة (MOT) تتطلب استنتاجًا متزامنًا حول بدء المسار، والهوية، والمسارات الفضائية-الزمنية. نُصِف هذه المهمة كمشكلة تنبؤ بالمجموعات بين الإطارات، ونقدّم TrackFormer، وهو نهج مُدرّب بشكل منتهٍ (end-to-end) لتتبع الكائنات المتعددة، مبني على بنية مُشفّرة-مُفكّكة (encoder-decoder) من نوع Transformer. يحقّق نموذجنا الربط بين الإطارات من خلال الانتباه (attention) من خلال تطوير مجموعة من تنبؤات المسارات عبر تسلسل الفيديو. يقوم مُفكّك Transformer بإنشاء مسارات جديدة من خلال استفسارات كائن ثابتة، ويتابع بشكل تكراري (autoregressively) المسارات الموجودة في الفضاء والزمن باستخدام استفسارات مسارات جديدة من حيث المفهوم وتحافظ على الهوية. وتستفيد كلا نوعي الاستفسارات من الانتباه الذاتي والانتباه بين المشفر والفكّاك على الميزات على مستوى الإطار الكلي، مما يُلغي الحاجة إلى أي تحسين رسمي إضافي أو نمذجة للحركة و/أو المظهر. يقدّم TrackFormer نموذجًا جديدًا لتتبع الكائنات عبر الانتباه، ورغم بساطة تصميمه، فإنه قادر على تحقيق أداءً يُعدّ الأفضل في مجال تتبّع الكائنات المتعددة (MOT17 وMOT20) وتقسيم الكائنات (MOTS20). يُمكن الاطلاع على الكود عبر الرابط: https://github.com/timmeinhardt/trackformer.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp