مقارنة بين SNNs وRNNs على مجموعات بيانات الرؤية العصبية: التشابهات والاختلافات

البيانات العصبية المُحاكية، التي تسجل أحداث النبضات دون إطار زمني (frameless spike events)، لاقت اهتمامًا كبيرًا بسبب مكوناتها المكانية الزمنية (spatiotemporal) ونمط المعالجة القائم على الأحداث (event-driven). تمثل الشبكات العصبية النبضية (SNNs) مجموعة من النماذج القائمة على الأحداث، والتي تتميز بديناميكيات مكانية زمنية، وتُعدّ أساسية في الحوسبة العصبية المُحاكية، وقد تم اختبارها على نطاق واسع باستخدام بيانات عصبية مُحاكية. من الجدير بالذكر أن الباحثين في مجتمع التعلم الآلي يمكنهم التأكيد على أن الشبكات العصبية التكرارية (RNNs) تمتلك أيضًا القدرة على استخلاص السمات المكانية الزمنية، رغم أنها ليست نماذج قائمة على الأحداث. وبالتالي، يطرح السؤال التالي: "ما الذي سيحدث إذا قمنا بمقارنة هذين النوعين من النماذج معًا على بيانات عصبية مُحاكية؟" – وهو سؤال ما زال غير واضح حتى الآن. في هذا العمل، نقوم بدراسة منهجية لمقارنة الشبكات العصبية النبضية (SNNs) والشبكات العصبية التكرارية (RNNs) على بيانات عصبية مُحاكية، مع أخذ مجموعات بيانات الرؤية كحالة دراسية. أولاً، نحدد التشابهات والاختلافات بين SNNs وRNNs (بما في ذلك RNNs الابتدائية وLSTM) من منظور النمذجة والتعلم. ولتحسين المقارنة والعدالة، نوحد خوارزمية التعلم المراقبة القائمة على التمرير العكسي عبر الزمن (BPTT)، ودالة الخسارة التي تستفيد من المخرجات في جميع اللحظات الزمنية، وهيكل الشبكة الذي يتكون من طبقات متعددة من الاتصال الكامل أو الطبقات التلافيفية (convolutional)، بالإضافة إلى المعايير الفائقة (hyper-parameters) أثناء التدريب. وبخاصة، وبما أن دالة الخسارة الشائعة المستخدمة في RNNs تُستخدم عادةً، نقوم بتعديلها مستوحاة من مبدأ التشفير بناءً على المعدل (rate coding) لتقريبها من دالة الخسارة المستخدمة في SNNs. علاوةً على ذلك، نقوم بتعديل دقة الزمن في مجموعات البيانات لاختبار مقاومة النماذج وقدرتها على التعميم. وأخيرًا، نُجري سلسلة من التجارب المقارنة على نوعين من مجموعات البيانات العصبية المُحاكية: N-MNIST الناتجة عن تحويل DVS، وDVS Gesture المُسجلة مباشرةً باستخدام DVS.