2달 전

소프트 레이어별 다중 작업 요약 및 의미 함의와 질문 생성

Han Guo; Ramakanth Pasunuru; Mohit Bansal
소프트 레이어별 다중 작업 요약 및 의미 함의와 질문 생성
초록

문서의 정확한 추상적 요약은 해당 문서의 모든 주요 정보를 포함하고 입력 문서에 논리적으로 포함되어야 합니다. 우리는 질문 생성과 함축 생성이라는 보조 작업을 활용한 다중 작업 학습을 통해 이러한 추상적 요약의 중요한 측면들을 개선합니다. 전자는 요약 모델이 주요 질문 가치가 있는 세부 사항을 찾는 방법을 가르치고, 후자는 모델이 입력 문서의 지시된 논리적 부분 집합으로 재작성하는 방법을 가르칩니다. 또한, 세 가지 작업의 여러 인코더 및 디코더 레이어에서 고수준(의미론적) 레이어별 공유와 소프트 공유 메커니즘을 제안하며, 각 기여도의 성능 분석 및 예제를 제시합니다. 전반적으로, 우리는 CNN/DailyMail 데이터셋과 Gigaword 데이터셋, 그리고 DUC-2002 전이 설정에서 최신 연구보다 통계적으로 유의미한 개선을 이루어냈습니다. 또한, 우리의 모델이 학습한 주요성과 함축 능력을 분석하기 위한 여러 양적 및 질적 연구를 제시합니다.

소프트 레이어별 다중 작업 요약 및 의미 함의와 질문 생성 | 최신 연구 논문 | HyperAI초신경