HyperAI

Open-Vocabulary-Bildklassifizierung ist eine Unterdisziplin im Bereich der Computer Vision, die darauf abzielt, genaue und detaillierte Klassifikationsbezeichnungen aus dem gesamten englischen Substantivvokabular zu generieren, ohne Prompts oder Kandidatenbezeichnungen zu verwenden. Das Ziel dieser Aufgabe besteht darin, spezifische Objekte oder Szenen in Bildern zu identifizieren und zu beschreiben, um die Generalisierungsfähigkeit des Modells für unbekannte Kategorien zu verbessern. Ihr Anwendungswert liegt in der Fähigkeit, große Mengen vielfältiger Bild-Daten zu verarbeiten und unterstützt so eine breitere Palette praktischer Anwendungsfälle wie intelligente Bildannotierung, Inhaltsretrieval und automatische Berichtserstellung.

OVIC Datasets (Wiki-H)

DFN-5B H/14-378 + PrefixedIter Decoder (FT2)

OVIC Datasets (World-H)

OVIC Datasets (Val3K)

OVIC Datasets (Wiki-L)

HyperAI

OVIC Datasets (Wiki-H)

DFN-5B H/14-378 + PrefixedIter Decoder (FT2)

OVIC Datasets (World-H)

OVIC Datasets (Val3K)

OVIC Datasets (Wiki-L)

Command Palette

Offene-Vokabular-Bildklassifizierung

Command Palette

Offene-Vokabular-Bildklassifizierung

Command Palette

Offene-Vokabular-Bildklassifizierung