HyperAIHyperAI

Command Palette

Search for a command to run...

FooDI-ML: Ein großes, mehrsprachiges Datensatz aus Bildern und Beschreibungen von Lebensmitteln, Getränken und Lebensmittelartikeln

David Amat Olóndriz Ponç Palau Puigdevall Adrià Salvador Palau

Zusammenfassung

In diesem Paper stellen wir den FooDI-ML-Datensatz vor. Dieser Datensatz enthält über 1,5 Mio. eindeutige Bilder sowie über 9,5 Mio. Geschäftsnamen, Produktnamen, Beschreibungen und Sammlungssektionen, die aus der Glovo-Anwendung gesammelt wurden. Die bereitgestellten Daten umfassen Lebensmittel, Getränke und Lebensmittelzubehör aus 37 Ländern in Europa, dem Nahen Osten, Afrika und Lateinamerika. Der Datensatz umfasst 33 Sprachen, darunter 870.000 Sprachproben aus Ländern Osteuropas und Westasiens wie Ukrainisch und Kasachisch, die bisher in öffentlich verfügbaren visuo-linguistischen Datensätzen unterrepräsentiert waren. Zudem sind weit verbreitete Sprachen wie Spanisch und Englisch enthalten. Zur Unterstützung weiterer Forschung liefern wir Benchmark-Ergebnisse für zwei Aufgaben: Text-Bild-Retrieval und bedingte Bildgenerierung.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp