Schwach überwachte Person-Re-ID: Differenzierbares graphisches Lernen und ein neuer Benchmark

Die Person-Re-Identifikation (Re-ID) profitiert erheblich von den genauen Annotationen bestehender Datensätze (z. B. CUHK03 [1] und Market-1501 [2]), die sehr kostspielig sind, da jedes Bild in diesen Datensätzen mit einem geeigneten Label versehen werden muss. In dieser Arbeit erleichtern wir die Annotation der Re-ID, indem wir die genaue Annotation durch eine ungenaue Annotation ersetzen, d. h., wir gruppieren die Bilder zeitlich in Säcke und weisen jedem Sack ein Sack-Level-Label zu. Dies reduziert den Annotationseinsatz erheblich und führt zur Erstellung eines groß angelegten Re-ID-Benchmarks namens SYSU-30$k$. Der neue Benchmark umfasst 30.000 Individuen, was etwa 20-mal so viele wie CUHK03 (1.300 Individuen) und Market-1501 (1.500 Individuen) sowie 30-mal so viele wie ImageNet (1.000 Kategorien) ist. Er enthält insgesamt 29.606.918 Bilder. Das Lernen eines Re-ID-Modells mit Sack-Level-Annotation wird als schwach überwachtes Re-ID-Problem bezeichnet. Um dieses Problem zu lösen, führen wir ein differenzierbares grafisches Modell ein, das die Abhängigkeiten aller Bilder in einem Sack erfassen und für jedes Personbild ein verlässliches Pseudolabel generieren kann. Das Pseudolabel wird anschließend verwendet, um das Lernen des Re-ID-Modells zu überwachen. Im Vergleich zu vollständig überwachten Re-ID-Modellen erreicht unsere Methode den aktuellen Stand der Technik auf SYSU-30$k$ und anderen Datensätzen. Der Code, der Datensatz und das vortrainierte Modell werden unter \url{https://github.com/wanggrun/SYSU-30k} zur Verfügung gestellt.