3달 전
임의의 허브(open-domain) 질문에 대한 답변을 위한 반복 문서 재정렬 기법
Ping Nie, Yuyu Zhang, Arun Ramamurthy, Le Song

초록
기존의 개방형 도메인 질의응답(QA) 접근 방식은 일반적으로 단일 힙(single-hop) 또는 다중 힙(multi-hop) 추론을 필요로 하는 질문을 대상으로 설계되어 있으며, 이는 답변해야 할 질문의 복잡성에 대해 강한 가정을 수반한다. 또한 다단계 문서 검색 과정에서는 관련은 하지만 지지 정보가 되지 않는 문서가 많아져, 이후의 답변 추출 모듈인 노이즈에 민감한 리더 모듈의 성능을 저하시킬 수 있다. 이러한 문제를 해결하기 위해, 본 연구에서는 임의의 힙 수(open-domain) 질문에 대해 통합적으로 대응할 수 있는 새로운 QA 프레임워크를 제안한다. 이 프레임워크는 문서를 반복적으로 검색하고, 재정렬하며, 필터링하는 방식으로 작동하며, 검색 과정을 언제 중단할지를 적응적으로 결정한다. 검색 정확도를 향상시키기 위해, 다중 문서 간 상호작용을 핵심으로 하는 그래프 기반 재정렬 모델을 제안한다. 제안한 방법은 단일 힙 및 다중 힙 개방형 QA 데이터셋인 Natural Questions Open, SQuAD Open, HotpotQA에서 모두 최신 기술 대비 경쟁력 있거나 더 우수한 성능을 일관되게 달성하였다.