فهم إعادة ترتيب استرجاع الصور: من منظور الشبكات العصبية الرسومية

تستفيد طريقة إعادة الترتيب من العينات المسترجعة بثقة عالية لتحسين نتائج الاسترجاع، وقد تم تبنيها على نطاق واسع كأداة معالجة ما بعد الاسترجاع للصور. ومع ذلك، لاحظنا عيبًا رئيسيًا في إعادة الترتيب، وهو التعقيد الحسابي العالي، مما يؤدي إلى تكلفة زمنية غير مقبولة للتطبيقات الواقعية. في هذا البحث، نعيد النظر في إعادة الترتيب ونثبت أن بإمكاننا صياغة إعادة الترتيب كدالة شبكة عصبية بيانية ذات موازاة عالية (GNN). بشكل خاص، نقسم عملية إعادة الترتيب التقليدية إلى مرحلتين: استرجاع عينات المعرض عالية الجودة وتحديث الخصائص. نعتقد أن المرحلة الأولى تعادل بناء الرسم البياني لأقرب k جارٍ (k-nearest neighbor graph)، بينما يمكن اعتبار المرحلة الثانية انتشار الرسالة داخل الرسم البياني. في الممارسة العملية، يتعين على الشبكة العصبية البيانية (GNN) فقط الاهتمام بالرؤوس التي تحتوي على حواف متصلة. نظرًا لأن الرسم البياني نادر الكثافة، يمكننا تحديث خصائص الرؤوس بكفاءة عالية. على مجموعة بيانات Market-1501، قمنا بتسريع عملية إعادة الترتيب من 89.2 ثانية إلى 9.4 ملي ثانية باستخدام بطاقة معالجة واحدة من نوع K40m، مما يسهل المعالجة الفورية ما بعد الاسترجاع. وبالمثل، لاحظنا أن طريقتنا تحقق نتائج استرجاع مماثلة أو حتى أفضل على أربع معايير أخرى لاسترجاع الصور وهي VeRi-776 وOxford-5k وParis-6k وUniversity-1652، مع تكلفة زمنية محدودة. شفرتنا متاحة للجمهور بشكل مجاني.希望这个翻译符合您的要求。如果有任何需要调整的地方,请随时告诉我。