HyperAIHyperAI

Command Palette

Search for a command to run...

الانتباه القائم على الذاكرة الزمنية للتصنيف الدلالي للفيديو

Hao Wang Weining Wang Jing Liu

الملخص

يتطلب التجزئة الدلالية للفيديو استغلال العلاقات الزمنية المعقدة بين الإطارات في تسلسل الفيديو. عادةً ما تستند الدراسات السابقة على تدفق بصري دقيق لاستغلال هذه العلاقات الزمنية، لكن هذا يُعاني من تكلفة حسابية عالية جدًا. في هذه الورقة، نقترح شبكة انتباه الذاكرة الزمنية (TMANet) التي تقوم بدمج العلاقات الزمنية الطويلة المدى على طول تسلسل الفيديو بشكل تكيفي، باستخدام آلية الانتباه الذاتي دون الحاجة إلى توقع تدفق بصري مفصل. بشكل خاص، نقوم ببناء ذاكرة باستخدام عدة إطارات سابقة لتخزين المعلومات الزمنية للإطار الحالي. ثم نقترح وحدة انتباه الذاكرة الزمنية لاستكشاف العلاقة بين الإطار الحالي والذاكرة، بهدف تعزيز تمثيل الإطار الحالي. تحقق طريقة عملنا أداءً جديدًا يُعدّ الأفضل في مجاله على نوعين من مجموعات بيانات التجزئة الدلالية للفيديو الصعبة، خاصةً بتحقيق دقة قدرها 80.3% في مقياس mIoU على مجموعة بيانات Cityscapes، و76.5% على مجموعة بيانات CamVid باستخدام نموذج ResNet-50.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp