أندرا باندرسناش: تدريب الشبكات العصبية لتوقع واقعيات متوازية

مستوحاة من تفسير العوالم المتعددة (MWI)، تقدم هذه الدراسة معمارية جديدة للشبكة العصبية تُقسم الإشارة المدخلة نفسها إلى فروع متوازية في كل طبقة، باستخدام دالة تنشيط زائفة (Hyper Rectified Activation)، تُعرف بـ ANDHRA. لا تندمج الطبقات الفرعية معًا، بل تُشكّل مسارات شبكة منفصلة، مما يؤدي إلى وجود عدة رؤوس للشبكة للتنبؤ بالنتائج. بالنسبة لشبكة تمتلك معامل فرعية قدره 2 على ثلاث مستويات، يكون العدد الإجمالي للرؤوس هو 2^3 = 8. تُدرَّب الرؤوس الفردية معًا من خلال دمج قيم الخسارة الخاصة بكل رأس. ومع ذلك، تتطلب المعمارية المقترحة معلمات وذاكرة إضافية أثناء التدريب بسبب الفروع الإضافية. أثناء الاستدلال، أظهرت النتائج التجريبية على مجموعتي بيانات CIFAR-10 وCIFAR-100 وجود رأس فردي يتفوق على دقة النموذج الأساسي، مع تحقيق تحسن إحصائيًا ملحوظًا مع نفس عدد المعلمات والتكلفة الحسابية.