HyperAIHyperAI

Command Palette

Search for a command to run...

Récupération Intermodale dans le Contexte Culinaire : Apprentissage d'Embeddings Sémantiques Texte-Image

Résumé

La conception d'outils puissants qui soutiennent les activités de cuisine a rapidement gagné en popularité grâce à la quantité massive de données disponibles et aux récentes avancées en apprentissage automatique capables de les analyser. Dans cet article, nous proposons un modèle de recherche intermodale qui aligne les données visuelles et textuelles (comme des images de plats et leurs recettes) dans un espace de représentation partagé. Nous décrivons un schéma d'apprentissage efficace, capable de traiter des problèmes à grande échelle, et nous le validons sur l'ensemble de données Recipe1M contenant près d'un million de paires image-recette. Nous montrons l'efficacité de notre approche par rapport aux modèles précédents de pointe et présentons des résultats qualitatifs sur des cas d'utilisation du calcul culinaire.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Récupération Intermodale dans le Contexte Culinaire : Apprentissage d'Embeddings Sémantiques Texte-Image | Articles | HyperAI