COREVQA 시각적 질문 답변 벤치마크 데이터 세트
COREVQA는 Algoverse 인공지능 연구센터에서 2025년에 발표한 시각적 질의응답 벤치마크 데이터셋입니다. 관련 논문 결과는 다음과 같습니다. "COREVQA: 군중 관찰 및 추론 함의 시각적 질의응답 벤치마크"이는 군중 장면에서 시각 언어 모델(VLM)의 추론 함의 능력을 평가하는 것을 목표로 합니다.
이 데이터셋은 5,608쌍의 이미지와 참/거짓 문장으로 구성되어 있습니다. 이미지는 CrowdHuman 데이터셋에서 추출되었습니다. 이 데이터는 주로 실제 혼잡한 장면을 묘사하며, 폐색, 시점 변화, 배경 간섭과 같은 난제를 강조합니다. 이 데이터는 복잡한 사회적 상황에서 VLM의 세밀한 인식 및 추론 능력을 향상시키는 것을 목표로 합니다.
데이터에는 다음이 포함됩니다.
- 장면 이미지(image_id)
- 자연어 진술(질문)
- 이진 레이블(정답:참/거짓)
코레브카.torrent
시딩 1다운로드 중 0완료됨 8총 다운로드 횟수 35