HyperAIHyperAI

Command Palette

Search for a command to run...

فكّك عدة خصائص في تسلسلات الفيديو باستخدام العمليات الغاوسية في مُشفّرات التوليد التلقائي التباينية

Sarthak Bhagat Shagun Uppal Zhuyun Yin Nengli Lim

الملخص

نُقدِّم نموذج MGP-VAE (مُشَرَّح التمثيلات متعددة الفصل باستخدام عمليات غاوسيّة في التشفير التلقائي التباعدي)، وهو نموذج تشفير تلقائي تباعدي يستخدم عمليات غاوسيّة (GP) لتمثيل الفضاء الخفي، بهدف التعلّم غير المُراقب لتمثيلات منفصلة في تسلسلات الفيديو. ونُحسِّن الأداء مقارنة بالعمل السابق من خلال إنشاء إطار عمل يُمكّن من فصل عدة خصائص، سواء كانت ثابتة أو ديناميكية. وبشكل خاص، نستخدم الحركات البنيّة الكسرية (fBM) والجسور البنيّة (BB) لفرض بنية ارتباط بين الإطارات في كل قناة مستقلة، ونُظهِر أن تغيير هذه البنية يُمكّن من التقاط عوامل مختلفة للتغير في البيانات. ونُظهر جودة تمثيلاتنا من خلال تجارب على ثلاث مجموعات بيانات متاحة للجمهور، كما نُقيّم التحسين من خلال مهمة تنبؤ بالفيديو. علاوةً على ذلك، نُقدِّم دالة خسارة جديدة تُسمى "الدالة التماثلية" (geodesic loss)، التي تأخذ بعين الاعتبار انحناء متعدّد البيانات لتحسين عملية التعلّم. وتُظهر تجاربنا أن الجمع بين التمثيلات المحسّنة والدالة التماثلية الجديدة يُمكّن نموذج MGP-VAE من تفوقه على النماذج الأساسية في مهام تنبؤ الفيديو.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
فكّك عدة خصائص في تسلسلات الفيديو باستخدام العمليات الغاوسية في مُشفّرات التوليد التلقائي التباينية | مستندات | HyperAI