2달 전

정형화된 자연어 질문 식별

Manaal Faruqui; Dipanjan Das
정형화된 자연어 질문 식별
초록

검색 쿼리를 이해하는 것은 사용자가 보편적으로 제출하는 "단어 샐러드" 텍스트를 처리해야 하기 때문에 어려운 문제입니다. 그러나 쿼리가 잘 구성된 질문과 유사하다면, 자연어 처리 파이프라인은 더 정확한 해석을 수행할 수 있어 후속 오류의 복합화를 줄일 수 있습니다. 따라서 쿼리가 잘 구성되었는지 여부를 식별하면 쿼리 이해를 개선할 수 있습니다. 이에 우리는 잘 구성된 자연어 질문을 식별하는 새로운 작업을 소개합니다. 우리는 공개적으로 이용 가능한 25,100개의 질문 데이터셋을 구축하고 배포하였으며, 이 데이터셋은 잘 구성된(well-formed)과 비잘 구성된(non-wellformed) 카테고리로 분류되었습니다. 테스트 세트에서 70.7%의 정확도를 보고하였습니다. 또한 우리의 분류기가 읽기 이해를 위한 질문 생성에 사용되는 신경 순차-순차 모델의 성능을 개선하는 데 활용될 수 있음을 보여주었습니다.

정형화된 자연어 질문 식별 | 최신 연구 논문 | HyperAI초신경