@misc{hao2025mllmsreasonmultimodalityemma, title={Can MLLMs Reason in Multimodality? EMMA: An Enhanced MultiModal ReAsoning Benchmark}, author={Yunzhuo Hao and Jiawei Gu and Huichen Will Wang and Linjie Li and Zhengyuan Yang and Lijuan Wang and Yu Cheng}, year={2025}, eprint={2501.05444}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2501.05444}, }

Datum

vor einem Jahr

Größe

228.19 MB

Organisation

Paper-URL

arxiv.org

Zitat

@misc{hao2025mllmsreasonmultimodalityemma,
title={Can MLLMs Reason in Multimodality? EMMA: An Enhanced MultiModal ReAsoning Benchmark},
author={Yunzhuo Hao and Jiawei Gu and Huichen Will Wang and Linjie Li and Zhengyuan Yang and Lijuan Wang and Yu Cheng},
year={2025},
eprint={2501.05444},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2501.05444},
}

EMMA.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 114Gesamtdownloads 244

EMMA/
- README.md
  1.6 KB
- README.txt
  3.21 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor einem Jahr

Größe

228.19 MB

Organisation

Paper-URL

arxiv.org

Zitat

@misc{hao2025mllmsreasonmultimodalityemma,
title={Can MLLMs Reason in Multimodality? EMMA: An Enhanced MultiModal ReAsoning Benchmark},
author={Yunzhuo Hao and Jiawei Gu and Huichen Will Wang and Linjie Li and Zhengyuan Yang and Lijuan Wang and Yu Cheng},
year={2025},
eprint={2501.05444},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2501.05444},
}

EMMA.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 114Gesamtdownloads 244

EMMA/
- README.md
  1.6 KB
- README.txt
  3.21 KB

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

vor 3 Stunden

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

in einer Stunde

Nemotron-SFT-Math-v4 Mathematische Inferenz SFT-Datensatz

vor 3 Stunden

ChartNet-Diagramme Verstehen Multimodale Datensätze

vor 18 Tagen

SMOL Multilingual Translation Parallel Dataset

vor 19 Tagen

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

vor 6 Tagen

ViMU-Datensatz Zum Verständnis Von Videometaphern

vor 19 Tagen

MemLens Multimodal Long Context Benchmark-Datensatz

vor 19 Tagen

VisCoR-55K Visual Inference Dataset

vor einem Monat

MathNet Multimodaler Mathematischer Benchmark-Datensatz Für Inferenz

vor einem Monat

Claw-Eval Real-World Benchmark Dataset

vor einem Monat

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

vor einem Tag

PanScale Remote Sensing Pancolor Sharpening Dataset

vor 2 Monaten

ParseBench-Dokumentparsing-Fähigkeitsbewertungsdatensatz

vor 2 Monaten

BRIGHT-Datensatz Zur Bewertung Von Katastrophengebäuden

vor einem Tag

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

vor einem Tag

MDPBench Multilingual Document Parsing Benchmark Dataset

vor einem Tag

GPT-5.4-Schritt-für-Schritt-Schlussfolgerungsdatensatz

vor 2 Monaten

DRACO Cross-Domain Deep Research Benchmark-Datensatz

vor 2 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

EMMA-Benchmark-Datensatz Für Multimodales Denken

Zitat

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

EMMA-Benchmark-Datensatz Für Multimodales Denken

Zitat

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

Nemotron-SFT-Math-v4 Mathematische Inferenz SFT-Datensatz

ChartNet-Diagramme Verstehen Multimodale Datensätze

SMOL Multilingual Translation Parallel Dataset

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

ViMU-Datensatz Zum Verständnis Von Videometaphern

MemLens Multimodal Long Context Benchmark-Datensatz

VisCoR-55K Visual Inference Dataset

MathNet Multimodaler Mathematischer Benchmark-Datensatz Für Inferenz

Claw-Eval Real-World Benchmark Dataset

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

PanScale Remote Sensing Pancolor Sharpening Dataset

ParseBench-Dokumentparsing-Fähigkeitsbewertungsdatensatz

BRIGHT-Datensatz Zur Bewertung Von Katastrophengebäuden

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

GPT-5.4-Schritt-für-Schritt-Schlussfolgerungsdatensatz

DRACO Cross-Domain Deep Research Benchmark-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

EMMA-Benchmark-Datensatz Für Multimodales Denken

Zitat

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

Nemotron-SFT-Math-v4 Mathematische Inferenz SFT-Datensatz

ChartNet-Diagramme Verstehen Multimodale Datensätze

SMOL Multilingual Translation Parallel Dataset

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

ViMU-Datensatz Zum Verständnis Von Videometaphern

MemLens Multimodal Long Context Benchmark-Datensatz

VisCoR-55K Visual Inference Dataset

MathNet Multimodaler Mathematischer Benchmark-Datensatz Für Inferenz

Claw-Eval Real-World Benchmark Dataset

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

PanScale Remote Sensing Pancolor Sharpening Dataset

ParseBench-Dokumentparsing-Fähigkeitsbewertungsdatensatz

BRIGHT-Datensatz Zur Bewertung Von Katastrophengebäuden

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

GPT-5.4-Schritt-für-Schritt-Schlussfolgerungsdatensatz

DRACO Cross-Domain Deep Research Benchmark-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

Nemotron-SFT-Math-v4 Mathematische Inferenz SFT-Datensatz

ChartNet-Diagramme Verstehen Multimodale Datensätze

SMOL Multilingual Translation Parallel Dataset

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

ViMU-Datensatz Zum Verständnis Von Videometaphern

MemLens Multimodal Long Context Benchmark-Datensatz

VisCoR-55K Visual Inference Dataset

MathNet Multimodaler Mathematischer Benchmark-Datensatz Für Inferenz

Claw-Eval Real-World Benchmark Dataset

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

PanScale Remote Sensing Pancolor Sharpening Dataset

ParseBench-Dokumentparsing-Fähigkeitsbewertungsdatensatz

BRIGHT-Datensatz Zur Bewertung Von Katastrophengebäuden

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

GPT-5.4-Schritt-für-Schritt-Schlussfolgerungsdatensatz

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

Nemotron-SFT-Math-v4 Mathematische Inferenz SFT-Datensatz

ChartNet-Diagramme Verstehen Multimodale Datensätze