RecipeNLG: Eine Rezeptdatenbank für die semi-strukturierte Textgenerierung

Die Generierung semi-strukturierter Texte stellt eine nicht triviale Aufgabe dar. Obwohl in den letzten Jahren dank der Entwicklung neuronaler Modelle, die auf großskaligen Datensätzen trainiert wurden, erhebliche Fortschritte in der natürlichen Sprachgenerierung erzielt wurden, stoßen diese Ansätze weiterhin auf Schwierigkeiten, strukturierte, kontext- und alltagswissensbasierte Texte zu erzeugen. Zudem ist unklar, wie die Qualität generierter Texte angemessen bewertet werden kann. Um diese Probleme anzugehen, stellen wir RecipeNLG vor – einen neuartigen Datensatz von Kochrezepten. Wir diskutieren den Prozess der Datensammlung sowie die Beziehung zwischen semi-strukturierten Texten und Kochrezepten. Anhand dieses Datensatzes nähern wir das Problem der Rezeptgenerierung an. Schließlich nutzen wir mehrere Metriken, um die generierten Rezepte zu evaluieren.