9 天前

RecipeNLG:一个用于半结构化文本生成的烹饪食谱数据集

{Agnieszka Ławrynowicz, Dawid Wiśniewski, Wojciech Taisner, Martyna Maciejewska, Michał Gilski, Michał Bień}
RecipeNLG:一个用于半结构化文本生成的烹饪食谱数据集
摘要

半结构化文本生成是一个具有挑战性的问题。尽管近年来得益于大规模数据集上训练的神经网络模型的发展,自然语言生成技术取得了显著进步,但现有方法在生成结构清晰、具备上下文感知能力及常识理解能力的文本方面仍面临困难。此外,目前尚缺乏明确的评估标准来衡量生成文本的质量。为应对上述挑战,我们提出了RecipeNLG——一个全新的烹饪食谱数据集。本文详细阐述了数据的收集过程,并探讨了半结构化文本与烹饪食谱之间的内在关联。基于该数据集,我们开展食谱生成任务的研究。最后,我们采用多种评估指标对生成的食谱进行综合评价。