Structural-RNN: التعلم العميق على الرسومات المكانية-الزمانية

هياكل الشبكات العصبية التكرارية العميقة، رغم قدرتها الملحوظة على نمذجة التسلسلات، تفتقر إلى بنية مكانية-زمانية عالية المستوى بديهية. أي أن العديد من المشكلات في رؤية الحاسوب تحمل بشكل جوهري بنية عالية المستوى ويمكن الاستفادة منها. تعتبر الرسوم البيانية المكانية-الزمانية أداة شائعة لفرض مثل هذه البديهيات على مستوى أعلى في صياغة المشكلات الواقعية. في هذا البحث، نقترح منهجًا يجمع بين قوة الرسوم البيانية المكانية-الزمانية عالية المستوى ونجاح تعلم التسلسلات بواسطة الشبكات العصبية التكرارية (RNNs). نطور طريقة قابلة للتوسع لتحويل أي رسم بياني مكاني-زماني إلى خليط غني من الشبكات العصبية التكرارية التي تكون ذات اتجاه واحد، قابلة للاشتقاق بالكامل، وقابلة للتدريب بشكل مشترك. الطريقة المقترحة عامة ومبدئية حيث يمكن استخدامها لتحويل أي رسم بياني مكاني-زماني من خلال توظيف مجموعة معينة من الخطوات المحددة جيدًا. تظهر تقييمات النهج المقترح على مجموعة متنوعة من المشكلات، تتراوح من نمذجة حركة الإنسان إلى تفاعلات الأشياء، تحسينًا كبيرًا على أحدث ما تم الوصول إليه في هذا المجال. نتوقع أن تعزز هذه الطريقة أساليب جديدة لصياغة المشكلات عبر الرسوم البيانية المكانية-الزمانية عالية المستوى والشبكات العصبية التكرارية.