HyperAIHyperAI

Command Palette

Search for a command to run...

Recipe1M+: Ein Datensatz zur Lern von multimodalen Einbettungen für Kochrezepte und Lebensmittelbilder

Javier Marín Aritro Biswas Ferda Ofli Nicholas Hynes Amaia Salvador Yusuf Aytar Ingmar Weber Antonio Torralba

Zusammenfassung

In dieser Arbeit stellen wir Recipe1M+ vor, ein neues großes, strukturiertes Korpus mit über einer Million Kochrezepten und 13 Millionen Lebensmittelbildern. Als die größte öffentlich verfügbare Sammlung von Rezeptdaten ermöglicht Recipe1M+ die Ausbildung von hochkapazitativen Modellen auf ausgerichteten, multimodalen Daten. Mit diesen Daten trainieren wir ein neuronales Netzwerk, um eine gemeinsame Einbettung von Rezepten und Bildern zu lernen, die beeindruckende Ergebnisse bei der Aufgabe der Bild-Rezept-Retrieval liefert. Darüber hinaus zeigen wir, dass Regularisierung durch Hinzufügen eines hochstufigen Klassifizierungsziels sowohl die Retrieval-Leistung verbessert, um mit der menschlichen Leistung konkurrieren zu können, als auch semantische Vektoralarithmetik ermöglicht. Wir vermuten, dass diese Einbettungen eine Grundlage für weitere Untersuchungen des Recipe1M+-Datensatzes sowie allgemein für das Thema Lebensmittel und Kochkunst bieten werden. Der Code, die Daten und die Modelle sind öffentlich verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Recipe1M+: Ein Datensatz zur Lern von multimodalen Einbettungen für Kochrezepte und Lebensmittelbilder | Paper | HyperAI