HyperAIHyperAI

Command Palette

Search for a command to run...

الانتباه ثنائي النموذج لفصل الكائنات في الفيديو بدون إشراف

Suhwan Cho$^1,*$ Minhyeok Lee$^1,*$ Seunghoon Lee$^1$ Dogyoon Lee$^1$ Heeseung Choi$^2$ Ig-Jae Kim$^2$ Sangyoun Lee$^1$

الملخص

يهدف التجزئة غير المراقبة للكائنات في الفيديو (VOS) إلى الكشف عن تجزئة أكثر الأشياء بروزًا في مقاطع الفيديو. teknikat الرئيسية المستخدمة في VOS غير المراقبة هي: 1) التعاون بين معلومات المظهر والحركة؛ و2) الاندماج الزمني بين الإطارات المختلفة. يقترح هذا البحث آليتين جديدتين للانتباه تعتمدان على النماذج الأولية، وهما الانتباه بين الوسائط (IMA) والانتباه بين الإطارات (IFA)، لدمج هذه التقنيات من خلال الانتشار الكثيف عبر الوسائط والإطارات المختلفة. تقوم IMA بدمج المعلومات السياقية من الوسائط المختلفة بشكل كثيف بناءً على تحسين متبادل. أما IFA فتقوم بحقن السياق العالمي للفيديو في الإطار الاستعلامي، مما يمكّن من استغلال الخصائص المفيدة من عدة إطارات بشكل كامل. تظهر نتائج التجارب على قواعد بيانات الاختبار العامة أن النهج المقترح يتفوق على جميع الأساليب الموجودة بمقدار كبير. كما تم التحقق الشامل من المكونين المقترحين عبر دراسة تقليصية (ablation study).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp