HyperAIHyperAI
منذ 2 أشهر

تجميع الخصائص التلافيفية العميقة لاسترجاع الصور

Artem Babenko; Victor Lempitsky
تجميع الخصائص التلافيفية العميقة لاسترجاع الصور
الملخص

أظهرت العديد من الدراسات الحديثة أن وصفيات الصور التي تنتجها الشبكات العصبية التلافيفية العميقة توفر أداءً رائدًا في مشاكل تصنيف واسترجاع الصور. كما تم إثبات أن التنشيطات من طبقات التلافيف يمكن تفسيرها كسمات محلية تصف مناطق صورية معينة. يمكن جمع هذه السمات المحلية باستخدام نهج الجمع المطور للاستخدام مع السمات المحلية (مثل متجهات فيشر)، مما يوفر وصفيات عالمية قوية جديدة.في هذا البحث، نستكشف الطرق المحتملة لجمع السمات العميقة المحلية لإنتاج وصفيات عالمية مضغوطة لاسترجاع الصور. أولاً، نبين أن السمات العميقة والسمات التقليدية المصممة باليد لديها توزيعات مختلفة بشكل كبير للتشابه الثنائي، وبالتالي يجب إعادة تقييم طرق الجمع الموجودة بعناية. يكشف مثل هذا التقييم الجديد أنه على عكس السمات الضحلة، فإن الطريقة البسيطة للجمع المستندة إلى جمع المسابح (sum pooling) توفر الأداء الأفضل حجة للسمات التلافيفية العميقة. هذه الطريقة فعالة، تحتوي على عدد قليل من المعلمات، وتتحمل خطر الانحراف الزائد بشكل ضئيل عند تعلم مصفوفة PCA مثلاً. بشكل عام، تحسن الوصفية العالمية الجديدة والمضغوطة الحالة الرائدة في أربعة مقاييس شائعة بشكل كبير.