HyperAIHyperAI
منذ 2 أشهر

استرجاع الكائنات الخاصة باستخدام تجميع الـ max-pooling المتكامل لتنشيطات الشبكة العصبية التلافيفية (CNN)

Giorgos Tolias; Ronan Sicre; Hervé Jégou
استرجاع الكائنات الخاصة باستخدام تجميع الـ max-pooling المتكامل لتنشيطات الشبكة العصبية التلافيفية (CNN)
الملخص

في الآونة الأخيرة، أثبتت تمثيلات الصور التي تعتمد على الشبكات العصبية المتكررة (CNN) فعاليتها في توفير واصفات للبحث عن الصور، حيث تفوقت على ميزات ما قبل الشبكات العصبية المتكررة كتمثيلات متجهات قصيرة. ومع ذلك، فإن هذه النماذج غير متوافقة مع طرق إعادة الترتيب التي تأخذ بعين الاعتبار الهندسة، وتظل أقل أداءً من أنظمة البحث التقليدية التي تعتمد على مطابقة الوصفات الدقيقة وإعادة الترتيب الهندسي أو توسيع الاستعلام في بعض مقاييس استرجاع الأشياء المحددة. يعيد هذا العمل النظر في مرحلتي الاسترجاع، وهما البحث الأولي وإعادة الترتيب، من خلال استخدام المعلومات الأولية المشتقة من الشبكة العصبية المتكررة نفسها. نقوم ببناء متجهات ميزات متراصة ترمّز لعدة مناطق صورية دون الحاجة إلى إدخال عدة مدخلات إلى الشبكة. بالإضافة إلى ذلك، نوسع نطاق الصور التكاملية لمعالجة عمليات الحد الأقصى للجمع (max-pooling) على تنشيطات الطبقات الإدراكية، مما يمكّننا من تحديد مواقع الأشياء المتطابقة بكفاءة. يتم استخدام الصندوق الحديدي الناتج في نهاية المطاف لإعادة ترتيب الصور. نتيجة لذلك، يحسن هذا البحث بشكل كبير خط الأنابيب الحالي المعتمد على الشبكات العصبية المتكررة: نقدم لأول مرة نتائج تنافس الأساليب التقليدية على مجموعتي البيانات الصعبتين Oxford5k وParis6k.