HyperAIHyperAI

Command Palette

Search for a command to run...

الشبكات العصبية المعرفية (CNNs) التي تم تدريبها على ImageNet متحيزة نحو النسيج؛ زيادة التحيز نحو الشكل يحسن الدقة والمتانة

Robert Geirhos Claudio Michaelis Felix A. Wichmann* Patricia Rubisch Matthias Bethge* Wieland Brendel*

الملخص

الشبكات العصبية المتكررة (CNNs) يُعتقد عمومًا أنها تعترف بالكائنات من خلال تعلم تمثيلات متزايدة التعقيد لأشكال الكائنات. ومع ذلك، تقترح بعض الدراسات الحديثة دورًا أكثر أهمية للملمسات في الصور. هنا نخضع هذه الفرضيات المتعارضة لاختبار كمي عبر تقييم الشبكات العصبية المتكررة والمراقبين البشريين على صور فيها تعارض بين مؤشرات الملمس والشكل. نوضح أن الشبكات العصبية المتكررة التي تم تدريبها على ImageNet متحيزة بشكل كبير نحو التعرف على الملمس بدلاً من الأشكال، وهو ما يختلف تمامًا عن الأدلة السلوكية البشرية ويكشف استراتيجيات تصنيف جوهرية مختلفة. ثم نثبت أن نفس الهندسة القياسية (ResNet-50) التي تتعلم تمثيلًا قائمًا على الملمس على ImageNet قادرة على تعلم تمثيل قائم على الشكل عندما يتم تدريبها على "Stylized-ImageNet" (نسخة ملساء من ImageNet). هذا يقدم توافقًا أفضل مع الأداء السلوكي البشري في إعداد مختبرنا النفسي الفيزيائي المحكم جيدًا (تسع تجارب بإجمالي 48,560 اختبارًا نفسيًا فيزيائيًا عبر 97 مراقبًا) ويأتي مع عدد من الفوائد الناشئة غير المتوقعة مثل أداء أفضل في اكتشاف الكائنات ومتانة لم يتم رؤيتها سابقًا أمام مجموعة واسعة من تشوهات الصور، مما يسلط الضوء على مزايا التمثيل القائم على الشكل.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp