HyperAI초신경

Zebra-CoT 텍스트-이미지 추론 데이터 세트

다운로드 도움말

Zebra-CoT는 컬럼비아 대학교, 메릴랜드 대학교, 남가주 대학교, 뉴욕 대학교가 2025년에 공동으로 공개한 시각 언어 추론 데이터셋입니다. 관련 논문 결과는 다음과 같습니다.Zebra-CoT: 인터리브 비전 언어 추론을 위한 데이터 세트"는 이미지와 텍스트 간의 논리적 관계를 더 잘 이해하기 위한 모델을 촉진하는 것을 목표로 하며, 시각적 질의 응답, 이미지 설명 생성 및 기타 분야에서 추론 능력과 정확성을 향상시키는 데 널리 사용됩니다.

이 데이터세트는 과학적 추론, 2D 시각 추론, 3D 시각 추론, 그리고 시각 논리 및 전략 게임의 4가지 주요 범주를 포괄하는 182,384개의 샘플을 포함합니다. 이 샘플들은 논리적으로 일관성 있는 텍스트-이미지 추론 추적을 포함합니다.

데이터 세트 구조:

  • 문제 설명: 문제에 대한 텍스트 설명입니다.
  • 질문 이미지: 질문의 특성에 따라 이미지가 0개 이상 포함될 수도 있습니다.
  • 추론 이미지: 문제 해결 과정에서 중간 추론 단계를 뒷받침하는 시각적 보조 자료가 하나 이상 있습니다.
  • 텍스트 추론 트랙: 일련의 텍스트 반영과 이에 상응하는 시각적 스케치 또는 다이어그램 플레이스홀더입니다.
  • 최종 답변: 문제에 대한 해결책.

데이터 세트 필드 분포 맵