9일 전
RecipeNLG: 반구조화된 텍스트 생성을 위한 요리 레시피 데이터셋
{Agnieszka Ławrynowicz, Dawid Wiśniewski, Wojciech Taisner, Martyna Maciejewska, Michał Gilski, Michał Bień}

초록
반구조화된 텍스트 생성은 비약간의 어려움을 안고 있는 문제이다. 최근 몇 년간 대규모 데이터셋으로 훈련된 신경망 모델의 발전 덕분에 자연어 생성 분야는 많은 발전을 이뤘지만, 여전히 구조적이고 맥락 및 보편지식을 고려한 텍스트를 생성하는 데 어려움을 겪고 있다. 게다가 생성된 텍스트의 품질을 평가하는 명확한 방법이 존재하지 않는다. 이러한 문제를 해결하기 위해 우리는 요리 레시피를 주제로 하는 새로운 데이터셋인 RecipeNLG를 소개한다. 본 연구에서는 데이터 수집 과정과 반구조화된 텍스트 및 요리 레시피 간의 관계를 논의하며, 이 데이터셋을 활용해 레시피 생성 문제에 접근한다. 마지막으로, 생성된 레시피의 품질을 평가하기 위해 다수의 평가 지표를 활용한다.