MSINet: البحث التبايني للتوأمين عن التفاعلات متعددة القياسات لإعادة تعريف الكائن

بحث العمارة العصبية (Neural Architecture Search - NAS) أصبح مثيرًا للاهتمام بشكل متزايد في مجتمع إعادة التعرف على الأشياء (Re-Identification - ReID)، حيث تساهم العمارة المحددة لل مهمة في تحسين أداء الاسترجاع بشكل كبير. ومع ذلك، فإن الأعمال السابقة تستكشف أهدافًا جديدة ومساحات بحثية لـ NAS ReID، لكنها تتجاهل الاختلاف بين خطط التدريب في تصنيف الصور وإعادة التعرف. في هذا العمل، نقترح آلية مقارنة توائم جديدة (Twins Contrastive Mechanism - TCM) لتوفير إشراف أكثر ملاءمة لبحث عمارة إعادة التعرف. تعمل TCM على تقليل التداخل الفئوي بين بيانات التدريب والتحقق، وتساعد NAS في محاكاة خطط التدريب الحقيقية لإعادة التعرف. ثم نصمم مساحة بحث للتفاعل متعدد المقاييس (Multi-Scale Interaction - MSI) للبحث عن عمليات تفاعل منطقية بين الميزات متعددة المقاييس. بالإضافة إلى ذلك، نقدم وحدة التناسق المكاني (Spatial Alignment Module - SAM) لتعزيز الاتساق الانتباهي عند التعامل مع صور من مصادر مختلفة. تحت الخطة المقترحة لـ NAS، يتم البحث تلقائيًا عن عمارة خاصة باسم MSINet. تظهر التجارب الواسعة أن طريقتنا تتفوق على أفضل الأساليب الحالية لإعادة التعرف في السيناريوهات داخل المجال وعبر المجالات. الرمز المصدر متاح في https://github.com/vimar-gu/MSINet.