HyperAIHyperAI

Command Palette

Search for a command to run...

فصل الأشياء الفيديوية التفاعلية باستخدام وحدات النقل العالمية والمحلية

Yuk Heo Yeong Jun Koh Chang-Su Kim

الملخص

يُقترح في هذا البحث خوارزمية تجزئة كائنات الفيديو التفاعلية، والتي تأخذ شروحات المستخدم على الكائنات المطلوبة كمدخلات. قمنا بتطوير شبكة عصبية عميقة تتكون من شبكة الشروح (A-Net) وشبكة النقل (T-Net). أولاً، عند تقديم شروحات المستخدم على إطار معين، تقوم A-Net بإنتاج نتيجة تجزئة تعتمد على بنية المشفّر-المفكك (الإنكودر-الديكودر). ثانياً، تقوم T-Net بنقل نتيجة التجزئة بشكل ثنائي الاتجاه إلى الإطارات الأخرى باستخدام وحدات النقل العالمية والمحلية. تعمل الوحدة العالمية للنقل على نقل معلومات التجزئة من الإطار المشروح إلى الإطار المستهدف، بينما تعمل الوحدة المحلية للنقل على نشر معلومات التجزئة من الإطار المجاور زمنياً إلى الإطار المستهدف. عن طريق تطبيق A-Net وT-Net بالتناوب، يمكن للمستخدم الحصول على نتائج التجزئة المرغوبة بأقل جهد ممكن. نقوم بتدريب الشبكة الكاملة في مرحلتين، من خلال تقليد شروحات المستخدم واستخدام خسارة مساعدة. تظهر النتائج التجريبية أن الخوارزمية التفاعلية المقترحة لتجزئة كائنات الفيديو تتفوق على الخوارزميات التقليدية الأكثر تقدماً. يمكن الوصول إلى الأكواد والنموذج عبر الرابط: https://github.com/yuk6heo/IVOS-ATNet.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
فصل الأشياء الفيديوية التفاعلية باستخدام وحدات النقل العالمية والمحلية | مستندات | HyperAI