Command Palette

Search for a command to run...

GenExam 다학문 문학 및 그래픽 시험 벤치마크 데이터 세트

날짜

한 달 전

크기

276.88 MB

기관

상하이 교통대학교
상하이 인공 지능 연구소
칭화대학교

논문 URL

2509.14232

라이선스

MIT

*이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

GenExam은 상하이 인공지능 연구소, 상하이 교통대학교, 칭화대학교 및 기타 기관들이 2025년에 발표한 최초의 다학제 텍스트-이미지 시험 방식 벤치마크 데이터셋입니다. 관련 논문 결과는 다음과 같습니다.GenExam: 다학제 텍스트-이미지 변환 시험"는 모델이 이해, 추론 및 생성 기능을 통합하여 실제로 도면 문제를 해결할 수 있는지 테스트하는 것을 목표로 합니다.

이 데이터세트는 수학, 물리, 화학, 생물학, 컴퓨터 과학, 공학, 의학, 예술, 지리, 역사 등 10개 분야에 걸쳐 약 1,000개의 고품질 예시를 포함하고 있습니다. 각 예시는 다양하고 도전적인 프롬프트, 해당 지상 진실 이미지, 그리고 세밀한 채점 점수를 포함하여 실제 시험의 엄격함과 난이도를 완벽하게 반영합니다. 이 데이터세트는 네 단계로 구성되었습니다. 약 40,000개의 이미지로 시작하여 GPT-5에서 자동으로 검토 및 프롬프트를 생성하고, 박사급 전문가의 엄격한 검토를 거쳐 최종적으로 앞서 언급한 1,000개의 다학제 예시가 탄생했습니다.

데이터 세트 예제

GenExam.torrent
시딩 1다운로드 중 0완료됨 6총 다운로드 횟수 25
  • GenExam/
    • README.md
      1.83 KB
    • README.txt
      3.65 KB
      • data/
        • GenExam.zip
          276.88 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
GenExam 다학문 문학 및 그래픽 시험 벤치마크 데이터 세트 | 데이터셋 | HyperAI초신경