COREVQA 시각적 질문 답변 벤치마크 데이터 세트

날짜

한 달 전

크기

5.63 GB

발행 주소

www.kaggle.com

논문 URL

2507.13405

라이선스

Apache 2.0

COREVQA는 Algoverse 인공지능 연구센터에서 2025년에 발표한 시각적 질의응답 벤치마크 데이터셋입니다. 관련 논문 결과는 다음과 같습니다. "COREVQA: 군중 관찰 및 추론 함의 시각적 질의응답 벤치마크"이는 군중 장면에서 시각 언어 모델(VLM)의 추론 함의 능력을 평가하는 것을 목표로 합니다.

이 데이터셋은 5,608쌍의 이미지와 참/거짓 문장으로 구성되어 있습니다. 이미지는 CrowdHuman 데이터셋에서 추출되었습니다. 이 데이터는 주로 실제 혼잡한 장면을 묘사하며, 폐색, 시점 변화, 배경 간섭과 같은 난제를 강조합니다. 이 데이터는 복잡한 사회적 상황에서 VLM의 세밀한 인식 및 추론 능력을 향상시키는 것을 목표로 합니다.

데이터에는 다음이 포함됩니다.

  • 장면 이미지(image_id)
  • 자연어 진술(질문)
  • 이진 레이블(정답:참/거짓)

코레브카.torrent
시딩 1다운로드 중 0완료됨 8총 다운로드 횟수 35
  • COREVQA/
    • README.md
      1.42 KB
    • README.txt
      2.85 KB
      • data/
        • COREVQA.zip
          5.63 GB
COREVQA 시각적 질문 답변 벤치마크 데이터 세트 | 데이터셋 | HyperAI초신경