شبكات العصبونات المتكررة للسلسلة الزمنية متعددة المتغيرات ذات القيم المفقودة

في التطبيقات العملية مثل الرعاية الصحية والعلوم الجيولوجية والأحياء، تتميز البيانات المتعددة المتغيرات على مدى الزمن بوجود مجموعة متنوعة من القيم المفقودة. وقد لوحظ في التنبؤ بالسلسلة الزمنية وفي المهام ذات الصلة أن القيم المفقودة وأنماطها المفقودة غالبًا ما تكون مرتبطة بالتصنيفات المستهدفة، وهو ما يعرف بـ "الفقدان المعلوماتي" (informative missingness). هناك أعمال قليلة جدًا تستغل أنماط الفقدان لتحقيق الإحلال الفعال وتحسين أداء التنبؤ. في هذا البحث، نطور نماذج تعلم عميقة جديدة، وهي GRU-D كأحد المحاولات الأولى. يعتمد GRU-D على وحدة التكرار المرتّبة ذات الأبواب (Gated Recurrent Unit - GRU)، وهي شبكة عصبية متكررة حديثة ومتطورة. يستخدم النموذج تمثيلين لأنماط الفقدان، وهما القناع (masking) والمدة الزمنية (time interval)، ويقوم بدمجهما بشكل فعال في بنية نموذج عميق بحيث لا يقتصر على التقاط الارتباطات الزمنية طويلة الأمد في السلسلة الزمنية فحسب، بل يستفيد أيضًا من أنماط الفقدان للحصول على نتائج تنبؤ أفضل. تظهر التجارب المتعلقة بمهام تصنيف السلاسل الزمنية على مجموعات بيانات سريرية حقيقية (مثل MIMIC-III و PhysioNet) وعلى مجموعات بيانات مصنعة أن نموذجنا يحقق أداءً رائدًا ويقدم رؤى مفيدة لفهم أفضل واستخدام القيم المفقودة في تحليل السلاسل الزمنية.