HyperAIHyperAI
منذ 11 أيام

TransMOT: رسم بياني للتحويلة الزمانية-المكانية لتعقب الكائنات المتعددة

Peng Chu, Jiang Wang, Quanzeng You, Haibin Ling, Zicheng Liu
TransMOT: رسم بياني للتحويلة الزمانية-المكانية لتعقب الكائنات المتعددة
الملخص

يعتمد تتبع الكائنات المتعددة في الفيديوهات على نمذجة التفاعلات المكانية-الزمنية بين الكائنات. في هذه الورقة، نقترح حلًا يُسمى TransMOT، الذي يستخدم نماذج التحويل الرسومية القوية لتمثيل التفاعلات المكانية والزمنية بين الكائنات بكفاءة. يتميز TransMOT بقدرته على نمذجة تفاعلات عدد كبير من الكائنات من خلال تنظيم مسارات الكائنات المُتتبعة كمجموعة من الرسوم البيانية الكثيفة الموزونة، وبناء طبقة رمزية تحويلية مكانية، وطبقة رمزية تحويلية زمنية، وطبقة فك ترميز تحويلية مكانية بناءً على هذه الرسوم البيانية. كما أن TransMOT ليس أكثر كفاءة من حيث الحوسبة مقارنة بالتحويلات التقليدية، بل يحقق أيضًا دقة تتبع أفضل. ولتحسين سرعة التتبع والدقة بشكل أكبر، نقترح إطارًا تسلسليًا للربط (cascade association framework) لمعالجة الكشفات ذات الدرجات المنخفضة والانسدادات الطويلة الأمد التي تتطلب موارد حوسبة كبيرة في TransMOT. تم تقييم الطريقة المقترحة على عدة مجموعات بيانات معيارية تشمل MOT15 وMOT16 وMOT17 وMOT20، وقد حققت أداءً متميزًا على جميع هذه المجموعات.