Command Palette
Search for a command to run...
MathNet 멀티모달 수학 벤치마크 추론 데이터셋
MathNet은 MIT 연구팀이 킹 압둘라 과학기술대학교 및 기타 기관과 협력하여 2026년에 공개한 대규모, 다국어, 다중 모드 수학적 추론 데이터셋입니다. 관련 연구 논문은 다음과 같습니다. MathNet: 수학적 추론 및 검색을 위한 글로벌 멀티모달 벤치마크이 도구는 올림픽 수준의 수학적 추론 및 구조화된 검색 작업에서 대규모 모델의 기능을 평가하고 개선하는 것을 목표로 하며, 수학적 추론 평가, RAG 연구 및 멀티모달 AI 훈련에 널리 사용됩니다. 이 데이터셋(버전 v0)은 27,817개의 전문가 수준 수학 문제와 표준 해답을 포함합니다. 58개 국가 및 지역의 공식 수학 경시대회 문제를 17개 언어로 제공하며, 그중 5,148개 문제는 총 7,541개의 기하학적 및 그래픽 삽화를 포함하고 있습니다. 데이터셋은 대수학, 기하학, 정수론, 조합론, 미적분학, 확률 및 통계, 그리고 기타 올림피아드 수학 지식 영역을 포괄합니다. 이 데이터셋은 수학 문제 풀이, 수학적 의미 검색(구조적으로 동일하거나 유사한 문제 식별), 그리고 검색 성능 향상이라는 세 가지 벤치마크 작업을 지원합니다.

소환
@inproceedings{alshammari2026mathnet,
title = {MathNet: A Global Multimodal Benchmark for Mathematical
Reasoning and Retrieval},
author = {Alshammari, Shaden and Wen, Kevin and Zainal, Abrar and
Hamilton, Mark and Safaei, Navid and Albarakati, Sultan and
Freeman, William T. and Torralba, Antonio},
booktitle = {International Conference on Learning Representations},
year = {2026},
url = {https://mathnet.mit.edu}
}