HyperAIHyperAI
منذ 11 أيام

المُتَرَجِّمَات التَّعْلِيمِيَّة العَالمِيَّة

Xingyi Zhou, Tianwei Yin, Vladlen Koltun, Philipp Krähenbühl
المُتَرَجِّمَات التَّعْلِيمِيَّة العَالمِيَّة
الملخص

نقدم معمارية جديدة تعتمد على المحولات (Transformer) للتتبع العالمي لعدة كائنات. يأخذ شبكتنا تسلسلاً قصيراً من الإطارات كمدخلات، ويُنتج مسارات عالمية لجميع الكائنات. يُشكّل المكون الأساسي محول التتبع العالمي، الذي يعمل على الكائنات من جميع الإطارات في التسلسل. يقوم المحول بتشفير سمات الكائنات من جميع الإطارات، ويستخدم استفسارات المسار لتنظيمها في مسارات. وتُعد استفسارات المسار هي سمات كائنات من إطار واحد، وتُنتج بشكل طبيعي مسارات فريدة. لا يتطلب محول التتبع العالمي لدينا تجميعاً زوجياً وسيطياً أو توصيلاً تكاملياً، ويمكن تدريبه بشكل مشترك مع كاشف الكائنات. ويحقق أداءً تنافسياً على معيار MOT17 الشهير، بـ 75.3 في المئة من MOTA و59.1 في المئة من HOTA. والأهم من ذلك، يتكامل إطار عملنا بسلاسة مع كاشفات الحروف الكبيرة الحديثة لتعقب أي كائنات. تُظهر التجارب على مجموعة بيانات TAO الصعبة أن إطار عملنا يُحسّن باستمرار على القواعد التي تعتمد على التوصيل الزوجي، ويتفوق على الدراسات المنشورة بنسبة 7.7 نقطة في مقياس mAP للتتبع. يمكن الوصول إلى الكود من خلال: https://github.com/xingyizhou/GTR.

المُتَرَجِّمَات التَّعْلِيمِيَّة العَالمِيَّة | أحدث الأوراق البحثية | HyperAI