التمييز الشخصي تحت الإشراف الضعيف: التعلم الرسومي القابل للمفاضلة ومعيار جديد

إعادة التعرف على الأشخاص (Re-ID) تستفيد بشكل كبير من التسميات الدقيقة للمجموعات البيانات الموجودة (مثل CUHK03 [1] و Market-1501 [2])، والتي تكون باهظة الثمن لأن كل صورة في هذه المجموعات يجب أن تُعطى تسمية مناسبة. في هذا العمل، نخفف من جهد التسمية بإحلال التسمية غير الدقيقة بدلاً من الدقيقة، أي أننا نقوم بفرز الصور إلى أكياس بناءً على الوقت ونُعطي لكل كيس تسمية على مستوى الكيس. هذا يقلل بشكل كبير من جهد التسمية ويؤدي إلى إنشاء معيار كبير الحجم لإعادة التعرف على الأشخاص يُدعى SYSU-30$k$. يحتوي المعيار الجديد على 30,000 فرد، وهو أكبر بحوالي 20 مرة من CUHK03 (1,300 فرد) و Market-1501 (1,500 فرد)، وأكبر بـ 30 مرة من ImageNet (1,000 تصنيف). ويبلغ العدد الإجمالي للصور فيه 29,606,918 صورة. تعلم نموذج Re-ID باستخدام تسمية على مستوى الكيس يُطلق عليه مشكلة إعادة التعرف على الأشخاص تحت الرقابة الضعيفة. لحل هذه المشكلة، نقدم نموذجاً بيانياً قابلاً للتفاضل لالتقاط الاعتمادات بين جميع الصور في الكيس وإنتاج تسمية زائفة موثوقة لكل صورة شخص. يتم استخدام التسمية الزائفة لمراقبة عملية تعلم نموذج Re-ID. عند مقارنتها مع النماذج التي تخضع للرقابة الكاملة لإعادة التعرف على الأشخاص، حققت طريقتنا أفضل الأداء على SYSU-30$k$ وعلى مجموعات بيانات أخرى. سيتم توفير الشيفرة البرمجية والمجموعة البيانات والنموذج المدرب مسبقاً في \url{https://github.com/wanggrun/SYSU-30k}.