11일 전

수학적 단어 문제를 위한 목표 지향형 트리 구조 신경 모델

{Zhipeng Xie and Shichao Sun}
수학적 단어 문제를 위한 목표 지향형 트리 구조 신경 모델
초록

현재까지 제안된 수학 단어 문제를 해결하기 위한 대부분의 신경망 모델은 왼쪽에서 오른쪽으로 순차적으로 해결 식을 생성하는 Seq2Seq 모델을 활용하고 있으나, 인간의 문제 해결 과정에서 흔히 볼 수 있는 목표 지향적 메커니즘의 부재로 인해 성능이 만족스럽지 못하다. 본 논문에서는 목표 지향적인 방식으로 표현식 트리를 생성하는 트리 구조 신경망 모델을 제안한다. 주어진 수학 단어 문제에 대해 모델은 먼저 달성하고자 하는 목표를 식별하고 인코딩한 후, 위에서 아래로 재귀적으로 연산자로 결합된 하위 목표로 분해한다. 이 과정은 목표가 이미 알려진 값으로 표현 가능한 단순한 리프 노드로 충분히 단순해질 때까지 반복된다. 이 과정 중 각 목표 분해 단계는 이중층 게이트형 피드포워드 네트워크를 통해 구현되며, 완료된 부분 트리를 서브트리 임베딩으로 인코딩하기 위해 재귀적 신경망이 사용된다. 이는 단순한 하위 목표보다 서브트리의 더 나은 표현을 제공한다. Math23K 데이터셋에 대한 실험 결과를 통해 제안하는 트리 구조 모델이 몇 가지 최첨단 모델들을 상당히 우수하게 성능으로 능가함을 확인할 수 있었다.

수학적 단어 문제를 위한 목표 지향형 트리 구조 신경 모델 | 최신 연구 논문 | HyperAI초신경