Open Vocabulary Image Classification
Open-Vocabulary-Bildklassifizierung ist eine Unterdisziplin im Bereich der Computer Vision, die darauf abzielt, genaue und detaillierte Klassifikationsbezeichnungen aus dem gesamten englischen Substantivvokabular zu generieren, ohne Prompts oder Kandidatenbezeichnungen zu verwenden. Das Ziel dieser Aufgabe besteht darin, spezifische Objekte oder Szenen in Bildern zu identifizieren und zu beschreiben, um die Generalisierungsfähigkeit des Modells für unbekannte Kategorien zu verbessern. Ihr Anwendungswert liegt in der Fähigkeit, große Mengen vielfältiger Bild-Daten zu verarbeiten und unterstützt so eine breitere Palette praktischer Anwendungsfälle wie intelligente Bildannotierung, Inhaltsretrieval und automatische Berichtserstellung.