Command Palette
Search for a command to run...
Cops-Ref-Datensatz Zum Verständnis Von Objektreferenzen
Datum
Veröffentlichungs-URL
Paper-URL
Lizenz
Andere

Cops-Ref steht für Compositional Referring Expression Comprehension und ist ein Bilddatensatz zum visuellen Verständnis von Zielobjektreferenzen. Der Datensatz enthält 75.299 reale Bilder, 148.712 Textbeschreibungen und 1.307.885 Kandidatenregionen.
Dieser Datensatz hat zwei Hauptmerkmale. Eine davon ist eine neue Textgenerierungs-Engine, die logisches Denken und visuelle Merkmale kombinieren kann, um Textbeschreibungen mit unterschiedlichen Komplexitätsgraden zu generieren. Zum anderen handelt es sich um eine neue Testeinstellung, die während des Tests mit semantisch ähnlichen visuellen Bildern interferiert.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.