التمييز السريع للكائنات في الفيديو باستخدام وحدة السياق الشامل

طورنا خوارزمية لتحديد كائنات الفيديو ذات الجودة العالية وذات التعلم شبه المراقبة في الوقت الفعلي. تتفوق دقتها على النموذج الأكثر دقةً الذي يستخدم التعلم المباشر، مع الحفاظ على سرعة مماثلة لأسرع طريقة مطابقة نمطية التي تتميز بدقة دون المستوى الأمثل. يُعد المكون الأساسي للنموذج هو وحدة سياق عالمية جديدة، والتي تُلخّص وتنقل المعلومات بشكل فعّال عبر مجموع الفيديو بالكامل. وعلى عكس الطرق السابقة التي تعتمد على إطار واحد أو عدة أطر لدليل عملية التجزئة في الإطار الحالي، تستخدم وحدة السياق العوالمي جميع الإطارات السابقة. وعلى عكس الشبكة ذات الذاكرة الفضائية الزمنية الأفضل حتى الآن التي تخزن ذاكرة عند كل موضع فضائي زماني، تستخدم وحدة السياق العوالمي تمثيلاً مميزاً بحجم ثابت. وبالتالي، فإنها تستخدم ذاكرة ثابتة بغض النظر عن طول الفيديو، وتستهلك ذاكرة وحسابات أقل بشكل كبير. وبفضل هذه الوحدة المبتكرة، يحقق نموذجنا أداءً متميزاً على المعايير القياسية في سرعة الوقت الفعلي.