Übertragbares Kontrastives Netzwerk für verallgemeinertes Zero-Shot-Lernen

Zero-Shot-Lernen (ZSL) ist ein anspruchsvolles Problem, das darauf abzielt, Zielkategorien zu erkennen, ohne gesehenes Datenmaterial. Dabei wird semantische Information genutzt, um Wissen von einigen Quellklassen zu übertragen. Obwohl ZSL in den letzten Jahren große Fortschritte gemacht hat, sind die meisten existierenden Ansätze in der generalisierten Zero-Shot-Lernaufgabe (GZSL) anfällig für das Überanpassen an die Quellklassen, was darauf hindeutet, dass sie nur wenig Wissen über die Zielklassen erlernen. Um dieses Problem zu bewältigen, schlagen wir ein neues Transferables Kontrastives Netzwerk (TCN) vor, das Wissen explizit von den Quellklassen auf die Zielklassen überträgt. Es vergleicht automatisch ein Bild mit verschiedenen Klassen, um festzustellen, ob diese konsistent sind oder nicht. Durch die Ausnutzung der Klassensimilaritäten zur Wissensübertragung von Quellbildern auf ähnliche Zielklassen ist unser Ansatz robuster bei der Erkennung von Zielbildern. Experimente auf fünf Benchmark-Datensätzen zeigen die Überlegenheit unseres Ansatzes für GZSL.