Command Palette
Search for a command to run...
CC12M Bild-Text-Paare-Datensatz
Datum
vor 3 Jahren
Veröffentlichungs-URL
Paper-URL
Lizenz
Andere
Tags

CC12M (Conceptual 12M) ist ein Datensatz aus Bild-Text-Paaren, der speziell für das Vortraining von Seh- und Sprachfähigkeiten entwickelt wurde. Der Datensatz enthält 12 Millionen Bild-Text-Paare. Im Vergleich zu CC3M weist dieser Datensatz bei der visuellen Long-Tail-Erkennung für mehrere nachgelagerte Aufgaben eine bessere Leistung auf.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.
KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Hyper Newsletters
Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp