2달 전
다중 유형 다중 구간 네트워크를 이용한 이산 추론이 필요한 독해 이해
Minghao Hu; Yuxing Peng; Zhen Huang; Dongsheng Li

초록
독해 및 질문 응답 분야에서 빠른 진전이 이루어져 일부 단순화된 환경에서는 여러 시스템이 인간 수준의 성능을 달성하였습니다. 그러나 이러한 모델들이 더 현실적인 상황, 예를 들어 다양한 유형의 답변이 필요하거나, 여러 텍스트 문자열이 올바른 답변이 되거나, 이산적 추론 능력이 요구되는 경우에 적용될 때 성능이 크게 저하됩니다. 본 논문에서는 다중 유형 다중 구간 네트워크(Multi-Type Multi-Span Network, MTMSN)를 소개합니다. 이는 다양한 답변 유형(예: 구간, 개수, 부정, 산술 표현 등)을 지원하도록 설계된 다중 유형 답변 예측기와 동적으로 하나 또는 여러 텍스트 구간을 생성하는 다중 구간 추출 방법을 결합한 신경망 독해 모델입니다. 또한, 산술 표현 재순위 결정 메커니즘이 제안되어 표현 후보들을 순위 매겨 예측을 더욱 확인할 수 있도록 합니다. 실험 결과, 본 모델은 DROP 숨겨진 테스트 세트에서 79.9 F1 점수를 기록하여 새로운 최신 연구 결과를 창출하였습니다. 소스 코드\footnote{\url{https://github.com/huminghao16/MTMSN}}가 공개되어 향후 연구를 촉진하기 위한 기반을 마련하였습니다.