Command Palette
Search for a command to run...
VQA(v2.0) 개방형 질의응답 데이터세트
VQA(v2.0)의 전체 이름은 Visual Question Answering(v2.0)이며, 이미지에 대한 수동으로 주석이 달린 개방형 질의응답 데이터 세트입니다. 이러한 질문에 답하려면 이미지, 언어, 상식에 대한 특정한 이해가 필요합니다.
예시 이미지:

데이터 세트에는 다음이 포함됩니다.
- 265,016개의 이미지(COCO 및 추상 장면 데이터 세트에서)
- 이미지당 질문 수는 3개 이상입니다(평균 5.4개 질문)
- 각 질문에는 10개의 기본 진실이 포함되어 있습니다.
- 각 질문에는 3개의 타당한(하지만 반드시 정답은 아닌) 답변이 있습니다.
- 자동 평가 지표
VQA 데이터 세트는 2015년 10월에 처음 출시되었고, VQA v2.0은 2017년 4월에 출시되었습니다.이 데이터 세트의 버전은 v2.0입니다.VQA v1.0에 비해 v2.0은 언어적 편향을 최소화하기 위해 각 질문에 이미지를 추가했습니다.
Visual_Question_Answering_(VQA).torrent
시딩 2다운로드 중 0완료됨 746총 다운로드 횟수 1,672