
초록
본 논문에서는 후보 답변을 순위화하는 새로운 엔드투엔드 신경망 구조를 제안합니다. 이 모델은 계층적 순환 신경망과 잠재 주제 클러스터링 모듈을 적용하여, 단어 수준에서 조각 수준까지의 벡터 표현으로 텍스트를 인코딩하여 전체 의미를 효과적으로 포착합니다. 특히, 계층적 구조를 적용함으로써 본 모델은 다른 최신 순환 신경망 모델들이 긴 텍스트 이해에서 성능 저하를 겪는 반면, 긴 텍스트에서도 매우 작은 성능 저하만을 보입니다. 또한, 잠재 주제 클러스터링 모듈은 대상 샘플에서 의미론적 정보를 추출합니다. 이 클러스터링 모듈은 각 데이터 샘플이 가장 가까운 주제 클러스터를 찾을 수 있도록 하여, 모든 텍스트 관련 작업에 유용하며 신경망 모델이 전체 데이터를 분석하는 데 도움을 줍니다. 우리는 제안된 모델을 Ubuntu 대화 코퍼스와 삼성 제품과 관련된 소비자 전자 제품 영역의 질문-답변 데이터셋에서 평가했습니다. 제안된 모델은 질문-답변 쌍의 순위화에서 최신 결과를 보였습니다.