17일 전

노이즈 제거를 통한 원거리 지도(open-domain) 질문 응답

{Yankai Lin, Maosong Sun, Zhiyuan Liu, Haozhe Ji}
노이즈 제거를 통한 원거리 지도(open-domain) 질문 응답
초록

원거리 지도(open-domain) 질문 응답(DS-QA)은 레이블이 없는 텍스트 컬렉션 내에서 답변을 찾는 것을 목표로 한다. 기존의 DS-QA 모델들은 대규모 코퍼스에서 관련 단락을 검색한 후, 독해 이해 기술을 활용해 가장 관련성이 높은 단락에서 답변을 추출하는 방식을 사용한다. 그러나 이러한 접근 방식은 다른 단락들에 포함된 풍부한 정보를 무시하게 된다. 더불어 원거리 지도 데이터는 불가피하게 잘못된 레이블링 문제를 동반하며, 이러한 노이즈가 많은 데이터는 DS-QA 모델의 성능을 크게 저하시킨다. 이러한 문제를 해결하기 위해, 우리는 노이즈가 포함된 단락을 필터링하는 단락 선택기(paragraph selector)와 노이즈가 제거된 단락들에서 정확한 답변을 추출하는 단락 독해기(paragraph reader)를 활용하는 새로운 DS-QA 모델을 제안한다. 실제 데이터셋에서 수행한 실험 결과, 제안하는 모델이 노이즈 데이터로부터 유용한 정보를 효과적으로 활용할 수 있으며, 모든 기준 모델 대비 유의미한 성능 향상을 달성함을 확인하였다.

노이즈 제거를 통한 원거리 지도(open-domain) 질문 응답 | 최신 연구 논문 | HyperAI초신경