ASET البيانات والتحدي لتشابه الصور لعام 2021

يقدم هذا البحث معيارًا جديدًا للكشف عن التشابه بين الصور على نطاق واسع. يتم استخدام هذا المعيار في تحدي التشابه بين الصور في مؤتمر NeurIPS'21 (ISC2021). الهدف هو تحديد ما إذا كانت صورة الاستفسار نسخة معدلة من أي صورة في مجموعة مرجعية تحتوي على مليون صورة. يشمل المعيار مجموعة متنوعة من تحويلات الصور، مثل التحويلات الآلية، التعديلات اليدوية للصور والتدوير المستند إلى التعلم الآلي. هذا يحاكي الحالات الحقيقية التي تظهر في وسائل التواصل الاجتماعي، مثل المشاكل المتعلقة بالنزاهة والتي تتعامل مع المعلومات الخاطئة والمحتوى غير اللائق. يتم ضبط قوة تعديلات الصور، وبالتالي صعوبة المعيار، وفقًا لأداء مجموعة من النماذج الأولية. تحتوي كلتا مجموعة الاستفسارات ومجموعة المرجع على أغلبية الصور "المشتتة" التي لا تتطابق، مما يتوافق مع الإعداد الحقيقي الذي يشبه إيجاد الإبرة في كومة القش، وتعكس المقاييس التقييمية ذلك. نتوقع أن يعزز معيار DISC21 الكشف عن نسخ الصور كمهمة مهمة وصعبة في مجال رؤية الكمبيوتر ويحدث حالة الفن الحالية. يمكن الحصول على الرمز والبيانات من https://github.com/facebookresearch/isc2021