Das Image Similarity-Datensatz- und -Challenge-Programm 2021

Dieses Papier stellt eine neue Benchmark für die Erkennung von Ähnlichkeiten in groß angelegten Bildern vor. Diese Benchmark wird für die Image Similarity Challenge bei NeurIPS'21 (ISC2021) verwendet. Das Ziel besteht darin, zu ermitteln, ob ein Abfragebild eine modifizierte Kopie eines Bildes aus einem Referenzkorpus mit einer Größe von 1 Million ist. Die Benchmark umfasst eine Vielzahl von Bildtransformationen, wie automatisierte Transformationen, manuell erstellte Bildbearbeitungen und maschinelles Lernen basierende Manipulationen. Dies simuliert realistische Szenarien, die in sozialen Medien auftreten können, beispielsweise bei Integritätsproblemen im Zusammenhang mit Falschinformationen und unangemessenen Inhalten. Die Stärke der Bildmanipulationen und damit die Schwierigkeit der Benchmark werden anhand der Leistung einer Reihe von Baseline-Methoden kalibriert. Sowohl das Abfrage- als auch das Referenzset enthalten eine Mehrheit von "Störbildern" (distractor images), die nicht übereinstimmen, was einer realistischen Nadel-im-Haufen-Situation entspricht. Das Evaluationsmaß spiegelt dies wider. Wir erwarten, dass die DISC21-Benchmark die Erkennung von Bildkopien als wichtige und anspruchsvolle Aufgabe im Bereich der Computer Vision fördert und den aktuellen Stand der Technik erneuert. Code und Daten sind unter https://github.com/facebookresearch/isc2021 verfügbar.