HyperAIHyperAI

Command Palette

Search for a command to run...

MOTR: تتبع الأشياء المتعددة من البداية إلى النهاية باستخدام الترانسفورمر

Zeng Fangao ; Dong Bin ; Zhang Yuang ; Wang Tiancai ; Zhang Xiangyu ; Wei Yichen

الملخص

النمذجة الزمنية للأجسام هي تحدي رئيسي في تتبع الأجسام المتعددة (MOT). تستخدم الطرق الحالية التتبع من خلال ربط الاكتشافات باستخدام تقنيات شبهية تعتمد على الحركة والمظهر. يمنع الطابع ما بعد المعالجة للربط استغلال التغيرات الزمنية في سلسلة الفيديو بشكل متكامل من البداية إلى النهاية. في هذا البحث، نقترح نظام MOTR، الذي يمتد لـ DETR ويقدم استعلام تتبع لنمذجة الحالات المتابعة في الفيديو بأكمله. يتم نقل واستعلام التتبع وتحديثه إطارًا بإطار لإجراء التنبؤ التكراري مع مرور الوقت. نقترح أيضًا تعيين تسميات واعٍ بالمسارات القصيرة لتدريب استعلامات التتبع والأشياء الجديدة. بالإضافة إلى ذلك، نقترح شبكة تجميع زمني وخسارة متوسطة جماعية لتعزيز نمذجة العلاقة الزمنية. تظهر النتائج التجريبية على DanceTrack أن نظام MOTR يتفوق بشكل كبير على أحدث الطرق المتبعة، ByteTrack بنسبة 6.5٪ حسب مؤشر HOTA. وعلى MOT17، يتفوق نظام MOTR على أعمالنا المتزامنة، TrackFormer وTransTrack، في أداء الربط. يمكن لنظام MOTR أن يعمل كأساس أكثر قوة للبحوث المستقبلية في النمذجة الزمنية ومتابعي Transformer. يمكن الوصول إلى الكود عبر الرابط:https://github.com/megvii-research/MOTR.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
MOTR: تتبع الأشياء المتعددة من البداية إلى النهاية باستخدام الترانسفورمر | مستندات | HyperAI