Zero-shot-Klassifikation unter Verwendung von Hyperdimensionalem Computing

Die Klassifikation auf Basis von Zero-shot Learning (ZSL) ist die Fähigkeit eines Modells, Eingaben in neue Klassen zu klassifizieren, für die das Modell zuvor keine Trainingsbeispiele gesehen hat. Eine gängige Herangehensweise zur Bewältigung dieser herausfordernden Aufgabe besteht darin, dem Modell eine Hilfsbeschreibung in Form eines Attributsets zur Verfügung zu stellen, das die neuen Klassen beschreibt. In dieser Arbeit, inspiriert durch Hyperdimensional Computing (HDC), schlagen wir die Verwendung stationärer binärer Codebücher mit symbolartigen verteilten Darstellungen innerhalb eines Attributencoders vor, um eine kompakte, recheneffiziente und end-to-end trainierbare Architektur zu realisieren, die wir Hyperdimensional Computing Zero-shot Classifier (HDC-ZSC) nennen. Das Modell besteht aus einem trainierbaren Bildencoder, einem auf HDC basierenden Attributencoder sowie einem Ähnlichkeitskern. Wir zeigen, dass HDC-ZSC zunächst zur Durchführung von Zero-shot-Attributextraktionsaufgaben eingesetzt werden kann und anschließend mit minimalen architektonischen Änderungen und geringem Neutrainingsaufwand für Zero-shot-Klassifikationsaufgaben wiederverwendet werden kann. HDC-ZSC erreicht eine pareto-optimale Leistung mit einer Top-1-Klassifikationsgenauigkeit von 63,8 % auf dem CUB-200-Datensatz, wobei lediglich 26,6 Millionen trainierbare Parameter verwendet werden. Im Vergleich zu zwei anderen state-of-the-art-Methoden, die nicht generativ sind, erzielt HDC-ZSC eine um 4,3 % und 9,9 % höhere Genauigkeit, während diese Methoden jeweils mehr als 1,85-fach bzw. 1,72-fach so viele Parameter erfordern wie HDC-ZSC.