17일 전
로컬 지식 그래프 구축을 활용한 Seq2Seq 모델의 다중 문서 입력 확장
Angela Fan, Claire Gardent, Chloe Braud, Antoine Bordes

초록
질의 기반 오픈도메인 자연어처리 작업은 긴 다양성 있는 웹 검색 결과에서 정보 통합이 필요하다. 기존의 접근 방식은 TF-IDF 순위 매기기와 같은 방법을 사용하여 웹 텍스트의 일부를 추출하여 시퀀스-투-시퀀스 모델의 입력으로 활용한다. 본 연구에서는 각 질의에 대해 로컬 그래프 구조의 지식 기반을 구축하는 방법을 제안한다. 이는 웹 검색 정보를 압축하고 중복을 줄이는 데 기여한다. 우리는 그래프를 선형화하여 구조화된 입력 시퀀스로 변환함으로써, 표준 시퀀스-투-시퀀스 환경 내에서 그래프 표현을 인코딩할 수 있음을 보였다. 긴 텍스트 입력을 필요로 하는 두 가지 생성형 작업, 즉 장문 질문 응답과 다중 문서 요약에 있어서, 검색된 텍스트 조각 대신 그래프 표현을 입력으로 사용할 경우 더 뛰어난 성능을 달성할 수 있음을 확인하였다.