HyperAIHyperAI

Command Palette

Search for a command to run...

تجميع الميزات العميقة المحلية لاسترجاع الصور

Artem Babenko Victor Lempitsky

الملخص

أظهرت عدة أعمال حديثة أن واصفات الصورة الناتجة عن الشبكات العصبية التلافيفية العميقة تحقق أداءً متفوقًا في مشكلات تصنيف الصور واسترجاعها. كما أُثبت أن التنشيطات الناتجة عن الطبقات التلافيفية يمكن تفسيرها على أنها ميزات محلية تصف مناطق معينة في الصورة. ويمكن تجميع هذه الميزات المحلية باستخدام طرق تجميع تم تطويرها لميزات محلية (مثل متجهات فيشر)، مما يُنتج واصفة عالمية قوية جديدة. في هذه الورقة، نستعرض الطرق الممكنة لتجميع الميزات العميقة المحلية بهدف إنتاج واصفات مختصرة للبحث عن الصور. أولاً، نوضح أن الميزات العميقة والميزات التقليدية المُصممة يدويًا تمتلك توزيعات مختلفة جدًا للتشابه الثنائي، وبالتالي يجب إعادة تقييم الطرق الحالية لتجميع الميزات بشكل دقيق. يُظهر هذا التقييم المُعاد أن الميزات العميقة التلافيفية تتفوق على الميزات السطحية في الأداء عند استخدام طريقة التجميع البسيطة القائمة على التجميع بالجمع (sum pooling)، حيث تتميز هذه الطريقة بالكفاءة، وعدد قليل من المعاملات، ومخاطر منخفضة من التعلّم الزائد عند، مثلاً، تعلّم مصفوفة تحليل المكونات الرئيسية (PCA). علاوةً على ذلك، نقترح خطة بسيطة وفعالة لتوسيع الاستعلام (query expansion) تناسب الطريقة المقترحة لتجميع الميزات. بشكل عام، تُحسّن الواصفة العالمية المختصرة الجديدة الأداء في أربع معايير شائعة بشكل ملحوظ، مما يُحدث تقدمًا في الحد الأقصى من الأداء الحالي في المجال.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp