HyperAIHyperAI
منذ 2 أشهر

الشبكات العصبية المعرفية (CNNs) التي تم تدريبها على ImageNet متحيزة نحو النسيج؛ زيادة التحيز نحو الشكل يحسن الدقة والمتانة

Robert Geirhos; Patricia Rubisch; Claudio Michaelis; Matthias Bethge; Felix A. Wichmann; Wieland Brendel
الشبكات العصبية المعرفية (CNNs) التي تم تدريبها على ImageNet متحيزة نحو النسيج؛ زيادة التحيز نحو الشكل يحسن الدقة والمتانة
الملخص

الشبكات العصبية المتكررة (CNNs) يُعتقد عمومًا أنها تعترف بالكائنات من خلال تعلم تمثيلات متزايدة التعقيد لأشكال الكائنات. ومع ذلك، تقترح بعض الدراسات الحديثة دورًا أكثر أهمية للملمسات في الصور. هنا نخضع هذه الفرضيات المتعارضة لاختبار كمي عبر تقييم الشبكات العصبية المتكررة والمراقبين البشريين على صور فيها تعارض بين مؤشرات الملمس والشكل. نوضح أن الشبكات العصبية المتكررة التي تم تدريبها على ImageNet متحيزة بشكل كبير نحو التعرف على الملمس بدلاً من الأشكال، وهو ما يختلف تمامًا عن الأدلة السلوكية البشرية ويكشف استراتيجيات تصنيف جوهرية مختلفة. ثم نثبت أن نفس الهندسة القياسية (ResNet-50) التي تتعلم تمثيلًا قائمًا على الملمس على ImageNet قادرة على تعلم تمثيل قائم على الشكل عندما يتم تدريبها على "Stylized-ImageNet" (نسخة ملساء من ImageNet). هذا يقدم توافقًا أفضل مع الأداء السلوكي البشري في إعداد مختبرنا النفسي الفيزيائي المحكم جيدًا (تسع تجارب بإجمالي 48,560 اختبارًا نفسيًا فيزيائيًا عبر 97 مراقبًا) ويأتي مع عدد من الفوائد الناشئة غير المتوقعة مثل أداء أفضل في اكتشاف الكائنات ومتانة لم يتم رؤيتها سابقًا أمام مجموعة واسعة من تشوهات الصور، مما يسلط الضوء على مزايا التمثيل القائم على الشكل.

الشبكات العصبية المعرفية (CNNs) التي تم تدريبها على ImageNet متحيزة نحو النسيج؛ زيادة التحيز نحو الشكل يحسن الدقة والمتانة | أحدث الأوراق البحثية | HyperAI