2달 전

신경망 데이터-텍스트 생성: 파이프라인 구조와 엔드투엔드 구조의 비교

Thiago Castro Ferreira; Chris van der Lee; Emiel van Miltenburg; Emiel Krahmer
신경망 데이터-텍스트 생성: 파이프라인 구조와 엔드투엔드 구조의 비교
초록

전통적으로 대부분의 데이터-텍스트 응용 프로그램은 비언어적 입력 데이터를 여러 중간 변환을 통해 자연 언어로 변환하는 모듈형 파이프라인 구조를 사용하여 설계되었습니다. 반면에, 최근 제안된 데이터-텍스트 생성을 위한 신경망 모델은 비언어적 입력을 중간 표현이 명시적으로 적게 포함된 상태에서 자연 언어로 렌더링하는 엔드투엔드 접근 방식으로 제시됩니다. 본 연구는 RDF 트리플로부터 텍스트를 생성하기 위한 신경망 파이프라인과 엔드투엔드 데이터-텍스트 접근 방식 간의 체계적인 비교를 소개합니다. 두 구조 모두 최신 딥러닝 방법, 즉 인코더-디코더 게이티드 순환 유닛(GRU) 및 트랜스포머를 활용하여 구현되었습니다. 자동 평가와 인간 평가 그리고 정성적 분석 결과, 생성 과정에서 명시적인 중간 단계를 갖는 것이 엔드투엔드 접근 방식보다 더 나은 텍스트를 생성한다는 것을 시사합니다. 또한 파이프라인 모델은 미처 보지 못한 입력에 대해 더 잘 일반화되는 것으로 나타났습니다. 데이터와 코드는 공개적으로 이용 가능합니다.

신경망 데이터-텍스트 생성: 파이프라인 구조와 엔드투엔드 구조의 비교 | 최신 연구 논문 | HyperAI초신경