2달 전

UniGeo: 수학적 표현 재구성을 통한 기하학적 논리 추론의 통합

Jiaqi Chen; Tong Li; Jinghui Qin; Pan Lu; Liang Lin; Chongyu Chen; Xiaodan Liang
UniGeo: 수학적 표현 재구성을 통한 기하학적 논리 추론의 통합
초록

기하 문제 해결은 딥 모델의 고차원 다중 모드 추론 능력을 평가하는 잘 알려진 테스트베드입니다. 대부분의 기존 연구에서는 계산과 증명이라는 두 주요 기하 문제를 일반적으로 두 가지 특정 작업으로 취급하여, 딥 모델이 여러 수학 작업에서 추론 능력을 통합하는 것을 방해하였습니다. 그러나 본질적으로, 이 두 작업은 유사한 문제 표현과 겹치는 수학적 지식을 가지고 있어, 딥 모델이 두 작업 모두에서 이해와 추론 능력을 향상시킬 수 있습니다. 따라서, 우리는 4,998개의 계산 문제와 9,543개의 증명 문제를 포함하는 대규모 통합 기하 문제 벤치마크인 UniGeo를 구축하였습니다. 각 증명 문제는 이유와 수학적 표현을 포함한 다단계 증명으로 주석이 달려 있으며, 이 증명은 계산 문제의 주석된 프로그램 시퀀스와 동일한 형식을 공유하는 증명 시퀀스로 쉽게 재구성될 수 있습니다. 또한, 우리는 계산과 증명 문제를 동시에 시퀀스 생성 형태로 처리할 수 있는 통합 다중 작업 기하 변환기 프레임워크인 Geoformer를 제시합니다. 최종적으로, 이러한 통합 접근법을 통해 두 작업 모두에서 추론 능력이 향상됨을 보여주었습니다. 더 나아가, 우리는 문제 해결 과정에서 수학적 표현을 예측하기 위한 Mathematical Expression Pretraining (MEP) 방법을 제안하여 Geoformer 모델의 성능을 개선하였습니다. UniGeo에서 수행한 실험 결과, 제안된 Geoformer가 계산 및 증명 문제에서 태스크 특화 모델 NGS보다 각각 5.6%와 3.2% 이상 높은 정확도를 얻어 최신 성능을 보였습니다.

UniGeo: 수학적 표현 재구성을 통한 기하학적 논리 추론의 통합 | 최신 연구 논문 | HyperAI초신경