HyperAI

초록

데이터에서 텍스트 생성을 위한 신경망적 접근 방식은 일반적으로 드문 입력 항목을 처리하기 위해 탈lexical화(delexicalisation) 또는 복사 메커니즘(copy mechanism)을 사용한다. 본 연구에서는 두 데이터셋(E2E 및 WebNLG)과 두 가지 평가 설정을 활용하여 이러한 두 가지 방법의 상대적 영향을 조사한다. 본 연구는 다음 사항을 보여준다. (i) 드문 항목은 성능에 크게 영향을 미친다; (ii) 탈lexical화와 복사 메커니즘을 결합하는 것이 가장 큰 성능 향상을 가져온다; (iii) 드문 항목 및 미관측 항목에 대해서는 복사 메커니즘이 성능이 떨어진다; (iv) 이러한 두 메커니즘의 영향은 데이터셋의 구성 방식과 훈련, 검증, 테스트 데이터로의 분할 방식에 따라 크게 달라진다.

벤치마크

벤치마크	방법론	지표
kg-to-text-generation-on-webnlg-2-0	SOTA-NPT	BLEU: 61 METEOR: 42 ROUGE: 71.0
kg-to-text-generation-on-webnlg-2-0-1	SOTA-NPT	BLEU: 48.0 METEOR: 36.0 ROUGE: 65.0

데이터 텍스트 생성에서 희귀 항목 다루기

{Claire Gardent Anastasia Shimorina}

초록

벤치마크

AI로 AI 구축

Hyper Newsletters

Command Palette

데이터 텍스트 생성에서 희귀 항목 다루기

{Claire Gardent Anastasia Shimorina}

초록

벤치마크

AI로 AI 구축

Hyper Newsletters