HyperAIHyperAI
منذ 17 أيام

CNN Filter DB: دراسة تجريبية للمرشحات التلافيفية المدربة

Paul Gavrikov, Janis Keuper
CNN Filter DB: دراسة تجريبية للمرشحات التلافيفية المدربة
الملخص

في الوقت الحالي، تظل العديد من الأسئلة النظرية والعملية المتعلقة بقابلية نقل الشبكات العصبية التلافيفية (CNNs) ومقاومتها للاختلالات غير محلولة. وعلى الرغم من الجهود البحثية المستمرة التي تتناول هذه المشكلات من زوايا متعددة، فإن معظم هذه النهج يمكن تعميمها في السياقات المرتبطة بعلم الحاسوب، لا سيما في دراسة تأثيرات الانزلاقات في التوزيعات الخاصة ببيانات الصور. في هذا السياق، نقترح دراسة الانزلاقات التي تحدث في المعاملات المُتعلمة للنماذج المدربة من الشبكات العصبية التلافيفية. ونركز هنا على خصائص توزيعات أنوية التلافيف 3×3 الأكثر استخدامًا. وقد جمعنا وقمنا بنشر مجموعة بيانات تتضمن أكثر من 1.4 مليار نواة من مئات الشبكات العصبية التلافيفية المدربة، باستخدام مجموعة واسعة من مجموعات البيانات والهياكل المعمارية والمهام البصرية. وفي أول حالة تطبيقية لمجموعة البيانات المقترحة، نُظهر خصائص مهمة جدًا لعدة نماذج مُدرّبة مسبقًا متاحة للجمهور، وتُستخدم في التطبيقات العملية: أولاً، نحلل الانزلاقات في التوزيع (أو غيابها) بين أنوية الشبكات المدربة عبر محاور متنوعة من المعايير الوظيفية، مثل فئة الصورة في مجموعة البيانات، أو نوع المهمة، أو البنية المعمارية، أو عمق الطبقة. وبناءً على هذه النتائج، نستنتج أن التدريب المسبق للنماذج يمكن أن ينجح على أي مجموعة بيانات، شريطة أن تحقق شروط الحجم والتباين. ثانيًا، نُظهر أن العديد من النماذج المُدرّبة مسبقًا تحتوي على أنوية مُفككة (degenerated filters)، مما يجعلها أقل مقاومة وأقل ملاءمة للتعديل الدقيق (fine-tuning) في المهام المستهدفة. رابط مجموعة البيانات والمشروع: https://github.com/paulgavrikov/cnn-filter-db

CNN Filter DB: دراسة تجريبية للمرشحات التلافيفية المدربة | أحدث الأوراق البحثية | HyperAI