Command Palette
Search for a command to run...
GenExam 다학문 문학 및 그래픽 시험 벤치마크 데이터 세트
*이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.
GenExam은 상하이 인공지능 연구소, 상하이 교통대학교, 칭화대학교 및 기타 기관들이 2025년에 발표한 최초의 다학제 텍스트-이미지 시험 방식 벤치마크 데이터셋입니다. 관련 논문 결과는 다음과 같습니다.GenExam: 다학제 텍스트-이미지 변환 시험"는 모델이 이해, 추론 및 생성 기능을 통합하여 실제로 도면 문제를 해결할 수 있는지 테스트하는 것을 목표로 합니다.
이 데이터세트는 수학, 물리, 화학, 생물학, 컴퓨터 과학, 공학, 의학, 예술, 지리, 역사 등 10개 분야에 걸쳐 약 1,000개의 고품질 예시를 포함하고 있습니다. 각 예시는 다양하고 도전적인 프롬프트, 해당 지상 진실 이미지, 그리고 세밀한 채점 점수를 포함하여 실제 시험의 엄격함과 난이도를 완벽하게 반영합니다. 이 데이터세트는 네 단계로 구성되었습니다. 약 40,000개의 이미지로 시작하여 GPT-5에서 자동으로 검토 및 프롬프트를 생성하고, 박사급 전문가의 엄격한 검토를 거쳐 최종적으로 앞서 언급한 1,000개의 다학제 예시가 탄생했습니다.

GenExam.torrent
시딩 1다운로드 중 0완료됨 6총 다운로드 횟수 25