Command Palette
Search for a command to run...
{Claire Gardent Anastasia Shimorina}

초록
데이터에서 텍스트 생성을 위한 신경망적 접근 방식은 일반적으로 드문 입력 항목을 처리하기 위해 탈lexical화(delexicalisation) 또는 복사 메커니즘(copy mechanism)을 사용한다. 본 연구에서는 두 데이터셋(E2E 및 WebNLG)과 두 가지 평가 설정을 활용하여 이러한 두 가지 방법의 상대적 영향을 조사한다. 본 연구는 다음 사항을 보여준다. (i) 드문 항목은 성능에 크게 영향을 미친다; (ii) 탈lexical화와 복사 메커니즘을 결합하는 것이 가장 큰 성능 향상을 가져온다; (iii) 드문 항목 및 미관측 항목에 대해서는 복사 메커니즘이 성능이 떨어진다; (iv) 이러한 두 메커니즘의 영향은 데이터셋의 구성 방식과 훈련, 검증, 테스트 데이터로의 분할 방식에 따라 크게 달라진다.
벤치마크
| 벤치마크 | 방법론 | 지표 |
|---|---|---|
| kg-to-text-generation-on-webnlg-2-0 | SOTA-NPT | BLEU: 61 METEOR: 42 ROUGE: 71.0 |
| kg-to-text-generation-on-webnlg-2-0-1 | SOTA-NPT | BLEU: 48.0 METEOR: 36.0 ROUGE: 65.0 |