16일 전

ATHENA: 사고 확장과 함께한 수학적 추론

JB. Kim, Hazel Kim, Joonghyuk Hahn, Yo-Sub Han
ATHENA: 사고 확장과 함께한 수학적 추론
초록

수학적 단어 문제를 해결하는 데는 문제를 어떻게 표현하는지, 즉 모델이 인간의 언어적 표현을 해석하는 관점에 따라 달라진다. 현실 세계의 상황에서는 동일한 수학적 연산이 다양한 방식으로 적용되기 때문에 이러한 접근 방식이 더욱 중요하다. 기존의 연구들은 훈련 예제의 정보성에 제한된 예측 전략만을 고려하여, 수학적 지식 습득 과정에서의 의미를 충분히 반영하지 못했다. 본 연구에서는 인간의 사고 확장 메커니즘을 신경망 전파 방식으로 모방함으로써 현실 세계의 복잡한 상황을 해결할 수 있도록, 주의 기반 사고 확장 네트워크 아키텍처(Attention-based THought Expansion Network Architecture, ATHENA)를 제안한다. ATHENA는 이전 단계에서 유도된 가능한 수학적 표현의 사고를 담은 후보들을 반복적으로 생성하고, 목표에 도달하는 유효한 경로를 선택함으로써 합리적인 사고를 도출한다. 실험 결과, ATHENA는 훈련 예제의 정보성 제한 상황에서도 다양한 질문에 대해 뛰어난 성능을 보이며, 이상적인 모델에 가까운 새로운 최고 수준의 성과를 달성함을 입증했다.

ATHENA: 사고 확장과 함께한 수학적 추론 | 최신 연구 논문 | HyperAI초신경