Command Palette
Search for a command to run...
{Gahgene Gweon Bugeun Kim Donggeon Lee Kyung Seo Ki}

초록
수학 단어 문제 해결은 자연어 처리 분야에서 부상하고 있는 연구 주제이다. 최근 수학 단어 문제 해결 과제를 해결하기 위해 연구자들은 기계 번역 작업에서 주로 사용되는 인코더-디코더 아키텍처를 적용해왔다. 최신의 신경망 모델은 수작업으로 설계된 특징(feature)을 사용하며, 주로 생성 기반(generation-based) 방법에 기반하고 있다. 본 논문에서는 수작업 특징을 사용하지 않고, 기존 신경망 모델에서 존재하는 두 가지 문제를 해결하는 GEO(Operators를 활용한 방정식 생성, Generation of Equations by utilizing Operators) 모델을 제안한다. 첫째, 도메인 특화 지식 특징의 누락 문제이며, 둘째, 인코더 수준의 지식 손실 문제이다. 도메인 특화 특징의 누락 문제를 해결하기 위해, 연산 그룹 차이 예측 및 은닉 쌍 예측이라는 두 가지 보조 작업을 설계하였다. 인코더 수준의 지식 손실 문제를 해결하기 위해, 연산 특징 전달(Operator Feature Feed Forward, OP3F) 계층을 도입하였다. 실험 결과, GEO 모델은 두 데이터셋에서 기존 최고 성능 모델을 초월하였으며, MAWPS에서 85.1%, DRAW-1K에서 62.5%의 정확도를 달성하였고, ALG514 데이터셋에서는 82.1%의 비교 가능한 성능을 기록하였다.
벤치마크
| 벤치마크 | 방법론 | 지표 |
|---|---|---|
| math-word-problem-solving-on-alg514 | GEO | Accuracy (%): 82.1 |
| math-word-problem-solving-on-draw-1k | GEO | Accuracy (%): 62.5 |
| math-word-problem-solving-on-mawps | GEO | Accuracy (%): 85.1 |