VQA-HAT 지능형 질의응답 데이터세트

VQA-HAT(VQA Human Attention)는 질문에 따라 이미지의 정보 영역을 평가할 수 있습니다. 코넬대 연구팀은 자원봉사자들에게 이미지의 특정 영역을 선명하게 하거나 흐리게 하도록 요청하여 인간의 시각적 주의에 대한 지도를 얻었습니다.
이 데이터 세트는 원래 VQA 데이터 세트의 이미지에 대한 인간의 시각적 주의 맵으로 구성됩니다. 여기에는 6만 개 이상의 인간 시각 주의 맵이 포함되어 있습니다.
VQA-HAT.torrent
시딩 1다운로드 중 1완료됨 412총 다운로드 횟수 372