VQA(v2.0) 개방형 질의응답 데이터세트
VQA(v2.0)의 전체 이름은 Visual Question Answering(v2.0)이며, 이미지에 대한 수동으로 주석이 달린 개방형 질의응답 데이터 세트입니다. 이러한 질문에 답하려면 이미지, 언어, 상식에 대한 특정한 이해가 필요합니다.
예시 이미지:

데이터 세트에는 다음이 포함됩니다.
- 265,016개의 이미지(COCO 및 추상 장면 데이터 세트에서)
- 이미지당 질문 수는 3개 이상입니다(평균 5.4개 질문)
- 각 질문에는 10개의 기본 진실이 포함되어 있습니다.
- 각 질문에는 3개의 타당한(하지만 반드시 정답은 아닌) 답변이 있습니다.
- 자동 평가 지표
VQA 데이터 세트는 2015년 10월에 처음 출시되었고, VQA v2.0은 2017년 4월에 출시되었습니다.이 데이터 세트의 버전은 v2.0입니다.VQA v1.0에 비해 v2.0은 언어적 편향을 최소화하기 위해 각 질문에 이미지를 추가했습니다.
Visual_Question_Answering_(VQA).torrent
시딩 1다운로드 중 1완료됨 570총 다운로드 횟수 1,327