HyperAIHyperAI
منذ 9 أيام

توقّع الإطارات المستقبلية الفعّال والحفاظ على المعلومات ومتعدّد الجوانب

{Yichao Lu, Wei Yu, Sanja Fidler, Steve Easterbrook}
توقّع الإطارات المستقبلية الفعّال والحفاظ على المعلومات ومتعدّد الجوانب
الملخص

يُعد استخدام كتل الحفاظ على الدقة ممارسة شائعة لتعظيم الحفاظ على المعلومات في التنبؤ بالفيديو، إلا أن استهلاكها العالي للذاكرة يحد بشكل كبير من سياقات تطبيقها. نقترح نموذج CrevNet، وهو شبكة قابلة للعكس شرطيًا، يعتمد على هياكل قابلة للعكس لبناء مشفرة ذات اتجاهين متماثلة (بيوجيكتيف) و Predictor دوري مكمل. يتمتع نموذجنا بخاصية مضمونة نظريًا من عدم فقدان المعلومات أثناء استخلاص الميزات، إلى جانب استهلاك منخفض جدًا للذاكرة وكفاءة حسابية عالية. وبفضل طبيعته الخفيفة، يمكننا دمج التحويلات الثلاثية الأبعاد (3D convolutions) دون قلق من عائق الذاكرة، مما يعزز قدرة النموذج على التقاط الاعتماديات الزمنية قصيرة وطويلة المدى. تحقق الطريقة المقترحة نتائج رائدة على مجموعات بيانات Moving MNIST وTraffic4cast وKITTI. كما نُظهر قابلية نقل طريقة التعلم ذاتيًا من خلال استغلال الميزات المكتسبة في المهمة التنبؤية للكشف عن الكائنات على مجموعة بيانات KITTI. تدل النتائج التنافسية على الإمكانات الكامنة لاستخدام CrevNet كاستراتيجية تدريب مسبق توليدية لتوجيه المهام التالية.