منذ 7 أشهر

الملخص

نقدّم نموذجًا لشبكة عصبية متكررة ذات ترتيب Z (Znet) لتنبؤ الإطارات المستقبلية في الفيديو بناءً على الملاحظات التاريخية. تتمثل المساهمتان الرئيسيتان، من منظورين مختلفين: النمذجة التحديدية والنمذجة العشوائية. أولاً، نقترح بنية جديدة لشبكة عصبية متكررة لتمثيل الديناميات التحديدية، حيث يتم تحديث الحالات الخفية وفقًا لمنحنى Z-Order، مما يعزز اتساق الميزات بين الطبقات المرآتية. ثانيًا، نُقدّم نهجًا تدريبيًا معاكسًا (adversarial training) لنموذج Znet ثنائي المسار، لتمثيل التغيرات العشوائية، حيث يُجبر نموذج Znet-Predictor على تقليد سلوك نموذج Znet-Probe. يمكّن هذا الهيكل ثنائي المسار من إجراء التدريب المعاكس في فضاء الميزات بدلًا من فضاء الصور. وتحقق نماذجنا دقة تنبؤ متقدمة جدًا على مجموعتي بيانات فيديو مختلفتين.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار