HyperAIHyperAI

Command Palette

Search for a command to run...

الانتشار الكائني عبر الانتباهات بين الإطارات لتقسيم المثيلات الفيديوية المستقرة زمنيًا

Anirudh S Chakravarthy Won-Dong Jang Zudi Lin Donglai Wei Song Bai Hanspeter Pfister

الملخص

يهدف التجزئة الفيديو للInstances إلى اكتشاف الكائنات وتقسيمها وتتبعها في الفيديو. تعتمد الطرق الحالية على توسيع خوارزميات التجزئة على مستوى الصورة إلى المجال الزمني. ومع ذلك، يؤدي ذلك إلى تجزئات غير مستقرة زمنيًا. في هذا العمل، نحدد جودة التجزئة الناتجة عن عدم الاستقرار الزمني كعائق رئيسي في الأداء. مستمدين من هذا التحفيز، نقترح طريقة لتجزئة الفيديو للInstances تخفف من مشكلة التفويت في الكشف. وبما أن هذه المشكلة لا يمكن حلها ببساطة باستخدام المعلومات المكانية، نستفيد من السياق الزمني من خلال استخدام الانتباه بين الإطارات (inter-frame attentions). يمكّن هذا الشبكة من إعادة التركيز على الكائنات المفقودة باستخدام تنبؤات المربعات (box predictions) من الإطار المجاور، وبالتالي التغلب على حالات التفويت في الكشف. تتفوق طريقة لدينا بشكل كبير على الخوارزميات السابقة من الدرجة المتقدمة باستخدام هيكل Mask R-CNN، حيث تحقق 36.0% من mAP على معيار YouTube-VIS. بالإضافة إلى ذلك، تتميز طريقة لدينا بالكامل بكونها تعمل في الوقت الفعلي (online) ولا تتطلب أي إطارات مستقبلية. يمكن الوصول إلى الكود الخاص بنا بشكل عام عبر الرابط: https://github.com/anirudh-chakravarthy/ObjProp.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
الانتشار الكائني عبر الانتباهات بين الإطارات لتقسيم المثيلات الفيديوية المستقرة زمنيًا | مستندات | HyperAI