PredRNN: شبكة عصبية متكررة للتعلم التنبؤي الزماني المكاني

يهدف التعلم التنبؤي للتسلسلات المكانية-الزمنية إلى إنتاج صور مستقبلية من خلال التعلم من السياق التاريخي، حيث يُعتقد أن الديناميات البصرية تمتلك هياكل معيارية يمكن تعلّمها باستخدام أنظمة فرعية تراكيبية. في هذه الورقة، تم نمذجة هذه الهياكل من خلال تقديم PredRNN، وهو شبكة تكرارية جديدة، حيث يتم فصل زوج من خلايا الذاكرة بشكل صريح، ويعملان بطرق انتقال تقريبًا مستقلة، ثم يشكلان تمثيلات موحدة للبيئة المعقدة. وبشكل محدد، بالإضافة إلى خلية الذاكرة الأصلية في LSTM، يتميز هذا الشبكة بتدفق ذاكرة على شكل زِيجْزَاج ينتشر في الاتجاهات الصاعدة والهابطة عبر جميع الطبقات، مما يمكّن الديناميات البصرية المُتعلّمة على مستويات مختلفة من الشبكة من التواصل. كما يستخدم الشبكة خسارة فصل الذاكرة لمنع خلايا الذاكرة من تعلّم ميزات متكررة. ونقترح أيضًا استراتيجية جديدة للتعلم التدريجي (curriculum learning) لفرض أن PredRNN يتعلّم الديناميات طويلة المدى من الإطارات السياقية، ويمكن تعميم هذه الاستراتيجية على معظم نماذج التسلسل إلى التسلسل. ونقدّم دراسات تحليلية مفصلة للتحقق من فعالية كل مكوّن. وتبين النتائج أن النهج المقترح يحقق نتائج تنافسية للغاية على خمسة مجموعات بيانات في سيناريوهات تنبؤية سواء دون أفعال أو بشروط الأفعال.