
초록
검색 엔진의 검색 효율성을 개선하기 위한 한 가지 기술은 문서의 내용과 관련되거나 대표적인 용어로 문서를 확장하는 것입니다. 질문 응답 시스템의 관점에서 보면, 이는 문서가 잠재적으로 답변할 수 있는 질문들을 포함할 수 있습니다. 이러한 관찰에 따라, 우리는 주어진 문서에 대해 어떤 쿼리가 제출될지를 예측하고, 그 예측을 바탕으로 순수한 시퀀스-투-시퀀스 모델을 사용하여 문서를 확장하는 간단한 방법을 제안합니다. 이 모델은 쿼리와 관련된 문서 쌍으로 구성된 데이터셋을 사용하여 훈련됩니다. 우리의 방법을 높은 효율성을 가진 재순위 부여 컴포넌트와 결합하면, 두 가지 검색 작업에서 최신 기술 수준의 성능을 달성할 수 있습니다. 지연 시간이 중요한 환경에서는 재순위 부여 없이 검색 결과만으로도 더 많은 계산 자원을 필요로 하는 신경망 재순위 부여기의 효율성에 근접하지만, 훨씬 빠릅니다.