2달 전

데이터-텍스트 생성에 대한 엔티티 모델링

Ratish Puduppully; Li Dong; Mirella Lapata
데이터-텍스트 생성에 대한 엔티티 모델링
초록

최근 데이터-텍스트 생성에 대한 접근 방식은 대규모 데이터셋의 사용과 엔드투엔드로 훈련된 신경망 구조의 적용 덕분에 큰 잠재력을 보여주고 있습니다. 이러한 모델들은 적절한 내용 선택, 일관성 있는 구조화, 그리고 문법적으로 표현하는 데 필요한 표현 학습에 의존하며, 개체를 단순히 어휘 토큰으로 취급합니다. 본 연구에서는 데이터-텍스트 생성을 위한 개체 중심의 신경망 구조를 제안합니다. 제안된 모델은 개체별 표현을 생성하고 이를 동적으로 업데이트합니다. 각 시간 단계에서 계층적 주의 메커니즘을 사용하여 데이터 입력과 개체 메모리 표현에 조건부로 텍스트가 생성됩니다. 우리는 RotoWire 벤치마크와 (5배 더 큰) 새로운 야구 영역 데이터셋에서 실험 결과를 제시합니다. 이 새로운 데이터셋은 우리가 직접 생성하였습니다. 실험 결과는 제안된 모델이 자동 평가와 인간 평가에서 경쟁력 있는 기준 모델들을 능가함을 보여줍니다.

데이터-텍스트 생성에 대한 엔티티 모델링 | 최신 연구 논문 | HyperAI초신경