VisualOverload 장면 이미지 이해 데이터 세트

날짜

15일 전

크기

601.3 MB

발행 주소

huggingface.co

라이선스

CC BY-SA 4.0

VisualOverload는 외부 지식에 의존하지 않고 복잡한 장면의 세부 사항에 대한 모델의 시각적 이해 및 추론 능력을 검사하는 것을 목표로 하는 장면 이미지 이해 평가 데이터 세트입니다.

이 데이터셋은 2,720개의 질의-답변 쌍을 포함하고 있으며, 이는 퍼블릭 도메인의 고해상도 그림으로 구성되어 있으며, 여러 등장인물, 행동, 하위 플롯, 그리고 복잡한 배경이 특징입니다. 이 질문들은 모델의 장면 이해도를 종합적으로 평가하기 위해 수동으로 설계되었습니다. 이 데이터셋은 시각적 질의-답변 연구, 상세한 이미지 이해 및 추론, 그리고 여러 등장인물과 요소가 포함된 복잡한 장면의 평가에 적합합니다.

데이터 세트 예제
비주얼오버로드.torrent
시딩 1다운로드 중 0완료됨 1총 다운로드 횟수 11
  • VisualOverload/
    • README.md
      1.31 KB
    • README.txt
      2.62 KB
      • data/
        • VisualOverload.zip
          601.3 MB