2달 전

단계별: 신경망 데이터-텍스트 생성에서 계획과 실현의 분리

Amit Moryossef; Yoav Goldberg; Ido Dagan
단계별: 신경망 데이터-텍스트 생성에서 계획과 실현의 분리
초록

데이터-텍스트 생성은 개념적으로 두 부분으로 나눌 수 있다: 정보의 순서와 구조화(계획) 그리고 정보를 설명하는 유창한 언어 생성(실현). 현대의 신경망 생성 시스템은 이 두 단계를 하나의 단일 엔드투엔드 미분 가능한 시스템으로 통합한다. 우리는 생성 과정을 입력에 충실한 기호적 텍스트 계획 단계와 실현에만 집중하는 신경망 생성 단계로 분리하는 방법을 제안한다. 플랜-텍스트 생성기의 학습을 위해 우리는 참조 텍스트를 해당 텍스트 계획과 일치시키는 방법을 제시한다. 추론 시간에는 새로운 입력에 대한 고품질 텍스트 계획을 선택하는 방법을 설명한다. 우리는 WebNLG 벤치마크에서 우리의 접근 방식을 구현하고 평가하였다. 결과는 텍스트 계획과 신경망 실현을 분리하면 indeed 시스템의 안정성과 적절성을 개선하면서 유창한 출력을 유지할 수 있음을 보여준다. 우리는 BLEU 점수와 수동 평가 모두에서 개선된 결과를 관찰하였다. 또한 우리의 접근 방식의 또 다른 장점은 동일한 입력에 대해 다양한 실현 결과를 출력할 수 있다는 점으로, 이는 생성된 텍스트 구조에 대한 명시적인 제어 가능성을 열어준다.注释:- "indeed" 在这里翻译为“실크”可能会显得过于口语化,因此直接翻译为“indeed”以保持正式性。- “수동 평가” 通常指手动评估,但在这里为了保持正式性和准确性,翻译为“수동 평가”(manual evaluation)。修改后的版本:데이터-텍스트 생성은 개념적으로 두 부분으로 나눌 수 있다: 정보의 순서와 구조화(계획) 그리고 정보를 설명하는 유창한 언어 생성(실현). 현대의 신경망 생성 시스템은 이 두 단계를 하나의 단일 엔드투엔드 미분 가능한 시스템으로 통합한다. 우리는 생성 과정을 입력에 충실한 기호적 텍스트 계획 단계와 실현에만 집중하는 신경망 생성 단계로 분리하는 방법을 제안한다. 플랜-텍스트 생성기의 학습을 위해 우리는 참조 텍스트를 해당 �ек스트 계획과 일치시키는 방법을 제시한다. 추론 시간에는 새로운 입력에 대한 고품질 텍스트 계획을 선택하는 방법을 설명한다. 우리는 WebNLG 벤치마크에서 우리의 접근 방식을 구현하고 평가하였다. 결과는 텍스트 계획과 신경망 실현을 분리하면 시스템의 안정성과 적절성을 개선하면서 유창한 출력을 유지할 수 있음을 보여준다. 우리는 BLEU 점수와 수동 평가(manual evaluation) 모두에서 개선된 결과를 관찰하였다. 또한 우리의 접근 방식의 또 다른 장점은 동일한 입력에 대해 다양한 실현 결과를 출력할 수 있다는 점으로, 이는 생성된 텍스트 구조에 대한 명시적인 제어 가능성을 열어준다.

단계별: 신경망 데이터-텍스트 생성에서 계획과 실현의 분리 | 최신 연구 논문 | HyperAI초신경