2달 전

문제 문장의 언어 변형을 생성하여 수학 문제 해결하기

Syed Rifat Raiyan; Md. Nafis Faiyaz; Shah Md. Jawad Kabir; Mohsinul Kabir; Hasan Mahmud; Md Kamrul Hasan
문제 문장의 언어 변형을 생성하여 수학 문제 해결하기
초록

수학적 추론의 예술은 지적 발전의 근본적인 기둥으로서 인간의 창조성을 육성하는 중심적인 촉매제 역할을 합니다. 연구자들은 최근 일반 인공지능(AI)에 향한 중요한 발걸음인 수학 문장 문제(MWP, Math Word Problems) 해결 과제를 중심으로 한 다수의 연구 결과를 발표했습니다. 이러한 기존 모델들은 얕은 휴리스틱과 왜곡된 상관관계에 의존하여 해답 표현을 도출하는 경향이 있습니다. 이 문제를 개선하기 위해 본 논문에서는 문제 문장의 언어 변형을 생성하는 MWP 솔버용 프레임워크를 제안합니다. 이 접근 방식은 각 변형 문제를 해결하고, 가장 많은 표를 받은 예측 표현을 선택하는 것을 포함합니다. 우리는 DeBERTa(Decoding-enhanced BERT with disentangled attention)를 인코더로 사용하여 그 풍부한 텍스트 표현과 강화된 마스크 디코더를 활용하여 해답 표현을 구성합니다. 또한, 벤치마크 데이터셋인 MAWPS(Math Word Problems)에서 선택적으로 샘플링된 MWP들의 재구성, 적대적, 및 역변형을 포함하는 어려운 데이터셋인 PARAMAWPS($\mathrm{P\small{ARA}\normalsize{MAWPS}}$)를 소개합니다. 우리는 이 데이터셋과 다른 벤치마크 데이터셋들을 사용하여 몇 가지 기준 MWP 솔버 모델들로 광범위한 실험을 수행했습니다. 실험 결과, 문제 문장의 언어 변형에 대한 학습과 후보 예측에 대한 투표가 모델의 수학적 추론 능력과 견고성을 개선함을 보였습니다. 우리는 우리의 코드와 데이터를 공개적으로 제공합니다.

문제 문장의 언어 변형을 생성하여 수학 문제 해결하기 | 최신 연구 논문 | HyperAI초신경