HyperAIHyperAI

Command Palette

Search for a command to run...

استخراج العلاقات بين الترابطات عبر الإطارات لتقسيم الدلالة في الفيديو

Guolei Sun Yun Liu Hao Tang Ajad Chhatkuli Le Zhang Luc Van Gool

الملخص

جوهر التجزئة الدلالية للفيديو (VSS) يتمثل في كيفية استغلال المعلومات الزمنية للتنبؤ. وقد ركّزت الجهود السابقة بشكل رئيسي على تطوير تقنيات جديدة لحساب الترابطات بين الإطارات المختلفة، مثل التدفق البصري (optical flow) والانتباه (attention). بدلًا من ذلك، يقدّم هذا البحث مساهمة من زاوية مختلفة من خلال استكشاف العلاقات بين الترابطات بين الإطارات، مما يتيح تجميعًا أفضل للمعلومات الزمنية. ونستكشف العلاقات بين الترابطات من جهتين: الارتباطات الذاتية ذات المقياس الواحد، والعلاقات متعددة المقاييس. مستلهمين من معالجة الميزات التقليدية، نقترح طريقة تحسين الترابطات ذات المقياس الواحد (SAR) وطريقة تجميع الترابطات متعددة المقاييس (MAA). ولتمكين تنفيذ MAA بشكل عملي، نقترح استراتيجية التمويه المختارة للرموز (STM)، التي تُستخدم لاختيار مجموعة فرعية من الرموز المرجعية المتسقة عبر المقاييس المختلفة عند حساب الترابطات، مما يُحسّن أيضًا كفاءة طريقتنا. في النهاية، تُستخدم الترابطات بين الإطارات المُعزّزة بواسطة SAR وMAA لجمع المعلومات الزمنية بشكل تكيفي. تُظهر التجارب التي أجريناها أن الطريقة المقترحة تتفوّق على أحدث الطرق في مجال التجزئة الدلالية للفيديو. يُمكن الوصول إلى الكود المصدر بشكل عام عبر الرابط التالي: https://github.com/GuoleiSun/VSS-MRCFA


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
استخراج العلاقات بين الترابطات عبر الإطارات لتقسيم الدلالة في الفيديو | مستندات | HyperAI