HyperAIHyperAI
منذ 2 أشهر

فيلم: الاستدلال البصري باستخدام طبقة التكييف العامة

Ethan Perez; Florian Strub; Harm de Vries; Vincent Dumoulin; Aaron Courville
فيلم: الاستدلال البصري باستخدام طبقة التكييف العامة
الملخص

نقدم طريقة تكييف عامة للشبكات العصبية تُعرف بـ FiLM: التحكم الخطي حسب الميزة (Feature-wise Linear Modulation). تقوم طبقات FiLM بالتأثير على حسابات الشبكة العصبية من خلال تحويل خطّي مُرتبطة بالمعلومات المستخدمة في التكييف، وهو تحويل بسيط يعتمد على كل ميزة بشكل منفصل. نوضح أن طبقات FiLM فعالة للغاية في الاستدلال البصري - الإجابة على الأسئلة المتعلقة بالصور والتي تتطلب عملية متعددة الخطوات وذات مستوى عالٍ - وهي مهمة أثبتت صعوبتها بالنسبة للطرق التقليدية للتعلم العميق التي لا تُنمِّذ الاستدلال بشكل صريح. تحديداً، نوضح في مهام الاستدلال البصري أن طبقات FiLM 1) تقلل النصف من خطأ الحالة الفنية المتقدمة لمعيار CLEVR، 2) تقوم بتكييف الميزات بطريقة متناسقة، 3) مقاومة للتلاعب والتعديلات الهيكلية، و4) تعمم جيدًا إلى بيانات جديدة ومثيرة للتحدي من أمثلة قليلة أو حتى بدون أمثلة (zero-shot).

فيلم: الاستدلال البصري باستخدام طبقة التكييف العامة | أحدث الأوراق البحثية | HyperAI