HyperAI
Command Palette
Search for a command to run...
VQA(v2.0) 개방형 질의응답 데이터세트
VQA(v2.0)의 전체 이름은 Visual Question Answering(v2.0)이며, 이미지에 대한 수동으로 주석이 달린 개방형 질의응답 데이터 세트입니다. 이러한 질문에 답하려면 이미지, 언어, 상식에 대한 특정한 이해가 필요합니다.
예시 이미지:
데이터 세트에는 다음이 포함됩니다.
- 265,016개의 이미지(COCO 및 추상 장면 데이터 세트에서)
- 이미지당 질문 수는 3개 이상입니다(평균 5.4개 질문)
- 각 질문에는 10개의 기본 진실이 포함되어 있습니다.
- 각 질문에는 3개의 타당한(하지만 반드시 정답은 아닌) 답변이 있습니다.
- 자동 평가 지표 VQA 데이터 세트는 2015년 10월에 처음 출시되었고, VQA v2.0은 2017년 4월에 출시되었습니다.**이 데이터 세트의 버전은 v2.0입니다.**VQA v1.0에 비해 v2.0은 언어적 편향을 최소화하기 위해 각 질문에 이미지를 추가했습니다.
Visual_Question_Answering_(VQA).torrent
시딩 2다운로드 중 0완료됨 835총 다운로드 수 1,931
이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.