HyperAIHyperAI

Command Palette

Search for a command to run...

MathNet 멀티모달 수학 벤치마크 추론 데이터셋

날짜

8일 전

조직

MIT

Paper URL

2604.18584

라이선스

CC BY 4.0

MathNet은 MIT 연구팀이 킹 압둘라 과학기술대학교 및 기타 기관과 협력하여 2026년에 공개한 대규모, 다국어, 다중 모드 수학적 추론 데이터셋입니다. 관련 연구 논문은 다음과 같습니다. MathNet: 수학적 추론 및 검색을 위한 글로벌 멀티모달 벤치마크이 도구는 올림픽 수준의 수학적 추론 및 구조화된 검색 작업에서 대규모 모델의 기능을 평가하고 개선하는 것을 목표로 하며, 수학적 추론 평가, RAG 연구 및 멀티모달 AI 훈련에 널리 사용됩니다. 이 데이터셋(버전 v0)은 27,817개의 전문가 수준 수학 문제와 표준 해답을 포함합니다. 58개 국가 및 지역의 공식 수학 경시대회 문제를 17개 언어로 제공하며, 그중 5,148개 문제는 총 7,541개의 기하학적 및 그래픽 삽화를 포함하고 있습니다. 데이터셋은 대수학, 기하학, 정수론, 조합론, 미적분학, 확률 및 통계, 그리고 기타 올림피아드 수학 지식 영역을 포괄합니다. 이 데이터셋은 수학 문제 풀이, 수학적 의미 검색(구조적으로 동일하거나 유사한 문제 식별), 그리고 검색 성능 향상이라는 세 가지 벤치마크 작업을 지원합니다.

데이터 세트 개요
데이터 세트 개요

소환

@inproceedings{alshammari2026mathnet,
title = {MathNet: A Global Multimodal Benchmark for Mathematical
Reasoning and Retrieval},
author = {Alshammari, Shaden and Wen, Kevin and Zainal, Abrar and
Hamilton, Mark and Safaei, Navid and Albarakati, Sultan and
Freeman, William T. and Torralba, Antonio},
booktitle = {International Conference on Learning Representations},
year = {2026},
url = {https://mathnet.mit.edu}
}

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
MathNet 멀티모달 수학 벤치마크 추론 데이터셋 | 데이터 세트 | HyperAI초신경