@misc{hao2025mllmsreasonmultimodalityemma, title={Can MLLMs Reason in Multimodality? EMMA: An Enhanced MultiModal ReAsoning Benchmark}, author={Yunzhuo Hao and Jiawei Gu and Huichen Will Wang and Linjie Li and Zhengyuan Yang and Lijuan Wang and Yu Cheng}, year={2025}, eprint={2501.05444}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2501.05444}, }

日付

1年前

サイズ

228.19 MB

データセット構成

論文URL

arxiv.org

タグ

マルチモーダル

数学

EMMA (Enhanced MultiModal reAsoning) は、中国電子科技大学、中山大学、ワシントン大学、マイクロソフトの研究チームによって 2025 年にリリースされたマルチモーダル推論ベンチマークデータセットです。関連する論文の結果は次のとおりです。MLLM はマルチモダリティで推論できますか? EMMA: 強化されたマルチモーダル推論ベンチマーク」は、マルチモーダル大規模モデル (MLLM) の複雑な推論機能を評価する標準化されたテストプラットフォームを提供することを目的としています。このデータセットは、有機化学 (42%)、数学 (32%)、物理学 (6%)、プログラミング (20%) の分野におけるマルチモーダル推論タスクに重点を置いています。 2,788 の質問が含まれており、そのうち 1,796 は新しく作成されたサンプルです。きめ細かなタスク分割をサポートし、画像とテキストの共同理解能力の向上を目指します。データタスクの種類には、化学反応シミュレーション、数学的グラフィックス推論、物理パストレーシング、プログラミング視覚化などがあります。

引用

@misc{hao2025mllmsreasonmultimodalityemma,
title={Can MLLMs Reason in Multimodality? EMMA: An Enhanced MultiModal ReAsoning Benchmark},
author={Yunzhuo Hao and Jiawei Gu and Huichen Will Wang and Linjie Li and Zhengyuan Yang and Lijuan Wang and Yu Cheng},
year={2025},
eprint={2501.05444},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2501.05444},
}

EMMA.torrent

シーディング 1ダウンロード中 0完了 114総ダウンロード数 244

EMMA/
- README.md
  1.6 KB
- README.txt
  3.21 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

1年前

サイズ

228.19 MB

データセット構成

論文URL

arxiv.org

タグ

マルチモーダル

数学

引用

@misc{hao2025mllmsreasonmultimodalityemma,
title={Can MLLMs Reason in Multimodality? EMMA: An Enhanced MultiModal ReAsoning Benchmark},
author={Yunzhuo Hao and Jiawei Gu and Huichen Will Wang and Linjie Li and Zhengyuan Yang and Lijuan Wang and Yu Cheng},
year={2025},
eprint={2501.05444},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2501.05444},
}

EMMA.torrent

シーディング 1ダウンロード中 0完了 114総ダウンロード数 244

EMMA/
- README.md
  1.6 KB
- README.txt
  3.21 KB

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

EMMAマルチモーダル推論ベンチマークデータセット

引用

AIでAIを構築

HyperAI Newsletters

Command Palette

EMMAマルチモーダル推論ベンチマークデータセット

引用

関連データセット

MAKIEVAL 多言語文化知識評価データセット

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

Nemotron-SFT-Math-v4 数学的推論SFTデータセット

ChartNetチャートの理解：マルチモーダルデータセット

SMOL多言語翻訳並列データセット

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

ViMUビデオメタファー理解データセット

MemLensマルチモーダル長コンテキストベンチマークデータセット

VisCoR-55K ビジュアル推論データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

PanScaleリモートセンシングPancolorシャープニングデータセット

ParseBench文書解析能力評価データセット

BRIGHT災害建物評価データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

MDPBench 多言語文書解析ベンチマークデータセット

GPT-5.4ステップバイステップ推論データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

AIでAIを構築

HyperAI Newsletters

Command Palette

EMMAマルチモーダル推論ベンチマークデータセット

引用

関連データセット

MAKIEVAL 多言語文化知識評価データセット

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

Nemotron-SFT-Math-v4 数学的推論SFTデータセット

ChartNetチャートの理解：マルチモーダルデータセット

SMOL多言語翻訳並列データセット

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

ViMUビデオメタファー理解データセット

MemLensマルチモーダル長コンテキストベンチマークデータセット

VisCoR-55K ビジュアル推論データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

PanScaleリモートセンシングPancolorシャープニングデータセット

ParseBench文書解析能力評価データセット

BRIGHT災害建物評価データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

MDPBench 多言語文書解析ベンチマークデータセット

GPT-5.4ステップバイステップ推論データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

AIでAIを構築

HyperAI Newsletters

関連データセット

MAKIEVAL 多言語文化知識評価データセット

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

Nemotron-SFT-Math-v4 数学的推論SFTデータセット

ChartNetチャートの理解：マルチモーダルデータセット

SMOL多言語翻訳並列データセット

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

ViMUビデオメタファー理解データセット

MemLensマルチモーダル長コンテキストベンチマークデータセット

VisCoR-55K ビジュアル推論データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

PanScaleリモートセンシングPancolorシャープニングデータセット

ParseBench文書解析能力評価データセット

BRIGHT災害建物評価データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

MDPBench 多言語文書解析ベンチマークデータセット

GPT-5.4ステップバイステップ推論データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

関連データセット

MAKIEVAL 多言語文化知識評価データセット

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

Nemotron-SFT-Math-v4 数学的推論SFTデータセット

ChartNetチャートの理解：マルチモーダルデータセット