HyperAI초신경

EMMA 다중 모드 추론 벤치마크 데이터 세트

다운로드 도움말

EMMA(Enhanced MultiModal reAsoning)는 중국 전자과학기술대학, 중산대학, 워싱턴대학, 마이크로소프트의 연구팀이 2025년에 발표한 다중 모달 추론 벤치마크 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.MLLM은 다중 모달리티에서 추론할 수 있는가? EMMA: 향상된 다중 모달 추론 벤치마크"는 다중 모드 대형 모델(MLLM)의 복잡한 추론 능력을 평가하기 위한 표준화된 테스트 플랫폼을 제공하는 것을 목표로 합니다.

이 데이터 세트는 유기화학(42%), 수학(32%), 물리학(6%), 프로그래밍(20%) 분야의 다중 모드 추론 작업에 중점을 두고 있습니다. 이 시험에는 2,788개의 질문이 포함되어 있으며, 그 중 1,796개가 새로 구성된 샘플입니다. 세분화된 업무 분할을 지원하고 이미지와 텍스트에 대한 공동 이해 능력을 향상시키는 것을 목표로 합니다. 데이터 작업 유형에는 화학 반응 시뮬레이션, 수학적 그래픽 추론, 물리적 경로 추적, 프로그래밍 시각화 등이 있습니다.

데이터 세트에서 다양한 학문 분야와 하위 작업의 비율