RecipeNLG : Un jeu de données de recettes culinaires pour la génération de texte semi-structuré

La génération de texte semi-structuré constitue un problème non trivial. Bien que les dernières années aient vu de nombreuses avancées dans la génération de langage naturel, grâce au développement de modèles neuronaux entraînés sur de grandes bases de données, ces approches peinent encore à produire des textes structurés, sensibles au contexte et au bon sens. En outre, il n’est pas clair comment évaluer la qualité des textes générés. Pour répondre à ces défis, nous introduisons RecipeNLG, un nouveau jeu de données dédié aux recettes de cuisine. Nous détaillons le processus de collecte des données ainsi que la relation entre les textes semi-structurés et les recettes culinaires. Nous utilisons ce jeu de données pour aborder le problème de la génération de recettes. Enfin, nous employons plusieurs métriques pour évaluer les recettes générées.