Command Palette
Search for a command to run...
We-Math2.0 標準ビジュアル数学推論ベンチマークデータセット
※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。
We-Math2.0-Standardは、北京郵電大学、テンセント、清華大学が2025年にリリースした視覚的数学推論のための標準データセットです。関連する論文結果は「WE-MATH 2.0: 視覚的な数学的推論を促す多目的MathBookシステム」は、診断可能、説明可能、比較可能な評価基準を提供することを目的としています。 このデータセットは、1,819の厳密に定義された知識原則を中心に統一されたラベル空間を構築し、各質問に原則を明示的に注釈付け、厳密にキュレーションすることで、全体として幅広くバランスの取れたカバレッジを実現し、特にこれまで十分にカバーされていなかった数学のサブフィールドと質問タイプを強化しています。このデータセットは、以下の二重拡張設計を採用しています。
- まず、質問ごとに複数の画像を使用して、複数のソースの視覚的証拠の統合と配置をテストします。
- 2 番目に、画像ごとに複数の質問を使用して、同じ視覚的コンテキストでの複数の原則の転送と概念の柔軟性をテストします。
各例は画像とテキストステムで構成され、質問の根拠となる知識原則と標準的な回答の注釈が添えられています。

データセットの概要
引用
@misc{qiao2025wemath20versatilemathbook,
title={We-Math 2.0: A Versatile MathBook System for Incentivizing Visual Mathematical Reasoning},
author={Runqi Qiao and Qiuna Tan and Peiqing Yang and Yanzi Wang and Xiaowan Wang and Enhui Wan and Sitong Zhou and Guanting Dong and Yuchen Zeng and Yida Xu and Jie Wang and Chong Sun and Chen Li and Honggang Zhang},
year={2025},
eprint={2508.10433},
archivePrefix={arXiv},
primaryClass={cs.AI},
url={https://arxiv.org/abs/2508.10433},
}