17일 전
R2-D2: 개방형 도메인 질의 응답을 위한 모듈러 기준 설정
Martin Fajcik, Martin Docekal, Karel Ondrej, Pavel Smrz

초록
본 연구는 새로운 네 단계의 오픈 도메인 질의응답(FAQ) 파이프라인인 R2-D2(Rank twice, reaD twice)를 제안한다. 이 파이프라인은 리트리버(retriever), 패스지 재정렬기(passage reranker), 추출형 독해기(extractive reader), 생성형 독해기(generative reader), 그리고 시스템의 모든 구성 요소로부터 최종 예측을 통합하는 메커니즘으로 구성된다. 우리는 이 모델이 NaturalQuestions, TriviaQA, EfficientQA 세 가지 오픈 도메인 QA 데이터셋에서 우수한 성능을 보이며, 특히 첫 두 데이터셋에서 최신 기술(SOTA)을 초월함을 입증하였다. 분석 결과는 다음과 같다: (i) 추출형 독해기와 생성형 독해기를 결합하면 정확도(Exact Match) 기준으로 최대 5점의 절대적 개선 효과를 얻을 수 있으며, 이는 동일한 모델을 서로 다른 하이퍼파라미터로 설정한 사후 평균 앙상블(posterior averaging ensemble)보다 적어도 두 배 이상 효과적임을 보여준다. (ii) 파라미터 수가 적은 추출형 독해기라도 추출형 QA 데이터셋에서는 생성형 독해기와 경쟁 가능한 성능을 달성할 수 있음을 확인하였다.