HyperAIHyperAI

Command Palette

Search for a command to run...

Grad-CAM++: تحسين التفسيرات البصرية لشبكات الCONV العميقة

Aditya Chattopadhyay Anirban Sarkar Prantik Howlader Vineeth N Balasubramanian

الملخص

خلال العقد الماضي، أثبتت نماذج الشبكات العصبية التلافيفية (CNN) نجاحها الكبير في حل المشكلات البصرية المعقدة. ومع ذلك، تعتبر هذه النماذج العميقة طرقًا "سوداء الصندوق" بسبب عدم فهم آليات عملها الداخلية. في السنوات الأخيرة، ازداد الاهتمام بشكل كبير بتطوير نماذج تعلم عميقة قابلة للشرح، وتعتبر هذه الورقة محاولة في هذا الاتجاه. بناءً على طريقة تم اقتراحها مؤخرًا تسمى Grad-CAM، نقترح طريقة معممة تسمى Grad-CAM++ يمكن أن توفر شروحات بصرية أفضل لتوقعات نموذج CNN، من حيث تحديد موقع الأشياء بشكل أفضل وكذلك شرح حدوث حالات متعددة من الأشياء في صورة واحدة، مقارنة بالطرق الرائدة حاليًا. نقدم دليلًا رياضيًا للطريقة المقترحة، والتي تستخدم تركيبًا موزونًا للمشتقات الجزئية الموجبة لخرائط الميزات الخاصة بالطبقة التلافيفية الأخيرة بالنسبة لدرجة فئة معينة كأوزان لإنشاء شرح بصري للعلامة الفصلية المقابلة. أظهرت تجاربنا الواسعة وتقييماتنا، سواء الذاتية أو الموضوعية، على مجموعات بيانات قياسية أن Grad-CAM++ توفر شروحات بصرية واعدة يمكن فهمها من قبل البشر لنمط CNN معين عبر مهام متعددة مثل التصنيف وإنشاء تعليقات الصور وتمييز الحركات ثلاثية الأبعاد؛ وكذلك في إعدادات جديدة مثل تقريب المعرفة (knowledge distillation).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp