منذ 7 أشهر

الملخص

تُعتبر تنبؤ الفيديو مشكلة صعبة بسبب احتواء الفيديو ليس فقط على معلومات فضائية ذات أبعاد عالية، بل أيضًا على معلومات زمنية معقدة. يمكن تنفيذ تنبؤ الفيديو من خلال العثور على خصائص في الإطارات الأخيرة واستخدامها لإنشاء تقريبات للإطارات القادمة. نحن نعالج هذه المشكلة من خلال فصل الخصائص الفضائية والزمنية في مقاطع الفيديو. نقدم شبكة قمع متبادل (MSnet) التي يتم تدريبها بطريقة معادية ثم تنتج خصائص فضائية خالية من المعلومات الحركية، وخصائص حركية لا تحتوي على معلومات فضائية. تقوم MSnet باستخدام الاتصال الموجه بالحركة ضمن بنية مستندة إلى المُشفِّر والمُفكِّك لتحويل الخصائص الفضائية من إطار سابق إلى وقت الإطار القادم. نوضح كيف يمكن استخدام MSnet للتنبؤ بالفيديو باستخدام التمثيلات المنفصلة. كما نجري تجارب لتقييم فعالية طريقة فصل الخصائص لدينا. تحصل MSnet على نتائج أفضل من الأساليب الأخرى الحديثة للتنبؤ بالفيديو رغم أنها لديها مُشفِّرات أكثر بساطة.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار