VisualOverload 장면 이미지 이해 데이터 세트
VisualOverload는 외부 지식에 의존하지 않고 복잡한 장면의 세부 사항에 대한 모델의 시각적 이해 및 추론 능력을 검사하는 것을 목표로 하는 장면 이미지 이해 평가 데이터 세트입니다.
이 데이터셋은 2,720개의 질의-답변 쌍을 포함하고 있으며, 이는 퍼블릭 도메인의 고해상도 그림으로 구성되어 있으며, 여러 등장인물, 행동, 하위 플롯, 그리고 복잡한 배경이 특징입니다. 이 질문들은 모델의 장면 이해도를 종합적으로 평가하기 위해 수동으로 설계되었습니다. 이 데이터셋은 시각적 질의-답변 연구, 상세한 이미지 이해 및 추론, 그리고 여러 등장인물과 요소가 포함된 복잡한 장면의 평가에 적합합니다.

비주얼오버로드.torrent
시딩 1다운로드 중 0완료됨 1총 다운로드 횟수 11