Command Palette

Search for a command to run...

4달 전

데이터 텍스트 생성에서 희귀 항목 다루기

{Claire Gardent Anastasia Shimorina}

데이터 텍스트 생성에서 희귀 항목 다루기

초록

데이터에서 텍스트 생성을 위한 신경망적 접근 방식은 일반적으로 드문 입력 항목을 처리하기 위해 탈lexical화(delexicalisation) 또는 복사 메커니즘(copy mechanism)을 사용한다. 본 연구에서는 두 데이터셋(E2E 및 WebNLG)과 두 가지 평가 설정을 활용하여 이러한 두 가지 방법의 상대적 영향을 조사한다. 본 연구는 다음 사항을 보여준다. (i) 드문 항목은 성능에 크게 영향을 미친다; (ii) 탈lexical화와 복사 메커니즘을 결합하는 것이 가장 큰 성능 향상을 가져온다; (iii) 드문 항목 및 미관측 항목에 대해서는 복사 메커니즘이 성능이 떨어진다; (iv) 이러한 두 메커니즘의 영향은 데이터셋의 구성 방식과 훈련, 검증, 테스트 데이터로의 분할 방식에 따라 크게 달라진다.

벤치마크

벤치마크방법론지표
kg-to-text-generation-on-webnlg-2-0SOTA-NPT
BLEU: 61
METEOR: 42
ROUGE: 71.0
kg-to-text-generation-on-webnlg-2-0-1SOTA-NPT
BLEU: 48.0
METEOR: 36.0
ROUGE: 65.0

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
데이터 텍스트 생성에서 희귀 항목 다루기 | 연구 논문 | HyperAI초신경