HyperAIHyperAI

Command Palette

Search for a command to run...

انتقال موجه بالحركة لتقسيم كائنات الفيديو بدون تدريب مسبق

Tianfei Zhou Shunzhou Wang Yi Zhou Yazhou Yao Jianwu Li Ling Shao

الملخص

في هذه الورقة، نقدّم شبكة انتقال مُنتبهة للحركة (MATNet) جديدة لتقسيم كائنات الفيديو بدون تدريب مسبق (zero-shot video object segmentation)، والتي تقدّم طريقةً مبتكرة لاستغلال معلومات الحركة لتعزيز تمثيل الكائنات الفراغي-الزمني. تم تصميم كتلة انتباه غير متماثلة، تُسمى انتقال مُنتبه للحركة (MAT)، ضمن مُشفّر مزدوج التدفق، حيث تحوّل السمات المرئية إلى تمثيلات مُنتبهة للحركة في كل مرحلة تلافيفية. وبهذه الطريقة، يصبح المُشفّر متداخلًا بشكل عميق، مما يسمح بتفاعلات هرمية وثيقة بين حركة الكائن والسمات المرئية. ويُعد هذا الأسلوب أفضل من البنية المزدوجة التدفق التقليدية، التي تتعامل مع الحركة والمرئيات بشكل منفصل في كل تدفق، وغالبًا ما تعاني من التكيف الزائد مع المعلومات المرئية. علاوةً على ذلك، تم اقتراح شبكة جسرية (bridge network) للحصول على تمثيل مكثّف، تميّزي، وحساس للقياس لسمات المُشفّر متعددة المستويات، والتي تُقدّم بعدها إلى فكّ المُشفّر لتحقيق نتائج التقسيم. وقد أظهرت التجارب الواسعة على ثلاث معايير عامة صعبة (DAVIS-16، FBMS، وYoutube-Objects) أن نموذجنا يحقق أداءً متميزًا مقارنةً بأفضل النماذج الحالية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp