13일 전

생성 및 순위 매기기: 수학적 단어 문제를 위한 다중 작업 프레임워크

Jianhao Shen, Yichun Yin, Lin Li, Lifeng Shang, Xin Jiang, Ming Zhang, Qun Liu
생성 및 순위 매기기: 수학적 단어 문제를 위한 다중 작업 프레임워크
초록

수학 단어 문제(Math Word Problem, MWP)는 자연어 처리 분야에서 도전적이고 핵심적인 과제이다. 최근 많은 연구들은 MWP를 생성(task)으로 공식화하고, 문제 설명을 수학적 표현으로 변환하기 위해 시퀀스-투-시퀀스 모델을 활용하고 있다. 그러나 수학적 표현은 미세한 오류를 범하기 쉬우며, 생성 목적 함수는 이러한 오류를 명시적으로 다루지 못하는 한계를 가진다. 이 문제를 해결하기 위해, 우리는 MWP를 위한 새로운 순위 지정(ranking) 작업을 제안하고, 생성형 사전 훈련 언어 모델 기반의 다중 작업 프레임워크인 Generate & Rank를 제안한다. 생성과 순위 지정을 함께 훈련함으로써 모델은 스스로의 오류로부터 학습하며, 정확한 표현과 오류가 포함된 표현을 구분할 수 있게 된다. 한편, MWP에 특화된 트리 기반의 방해 요소(扰动, disturbance)를 도입하고, 순위 지정 모델을 온라인으로 업데이트하는 기법을 적용하여 성능을 향상시켰다. 제안한 방법의 효과성을 벤치마크 데이터셋을 통해 검증한 결과, 모든 데이터셋에서 기존의 최고 성능 기법들을 일관되게 상회함을 확인하였다. 특히 전통적인 Math23k 데이터셋에서는 기존 최고 성능 기법 대비 7%포인트(78.4% → 85.4%) 높은 성능을 기록하였다.

생성 및 순위 매기기: 수학적 단어 문제를 위한 다중 작업 프레임워크 | 최신 연구 논문 | HyperAI초신경