
초록
대화형 질문 응답(ConvQA)은 후속 질문의 맥락이 암시적으로 남겨진 순차적 정보 요구를 다룹니다. 기존의 ConvQA 시스템은 동질적인 정보 원천—즉 지식 기반(KB), 텍스트 코퍼스, 또는 표의 집합—위에서 작동합니다. 본 논문은 이러한 다양한 정보 원천을 동시에 활용하는 새로운 문제에 주목하며, 이를 통해 답변의 커버리지와 신뢰도를 향상시킵니다. 우리는 이종 정보 원천을 대상으로 하는 엔드투엔드(ConvQA) 파이프라인인 CONVINSE를 제안합니다. 이 시스템은 세 단계로 구성됩니다: i) 들어오는 질문과 대화 맥락에 대해 명시적인 구조화된 표현을 학습하고, ii) 이 프레임 기반 표현을 활용해 지식 기반, 텍스트, 표에서 일관되게 관련 근거를 추출하며, iii) 디코더 내에서 융합(fusion-in-decoder) 모델을 실행하여 답변을 생성합니다. 또한, 실제 사용자 대화 3,000건(질문 총 16,000개)을 포함하고, 엔티티 주석, 완성된 질문 표현, 질문의 동의어 표현을 제공하는, 이종 정보 원천을 위한 최초의 벤치마크인 ConvMix를 구축하고 공개합니다. 실험 결과는 제안한 방법이 최첨단 기준 대비 실현 가능성과 우수성을 입증합니다.