Visual Genome의 고밀도 주석 데이터 세트

Visual Genome Dataset은 다중 선택 환경에서 Visual Question Answering 데이터를 포함하여 크라우드소싱된 고밀도 이미지 주석을 통해 언어와 시각을 연결하는 데이터 세트입니다.
이 데이터 세트는 101,174개의 MSCOCO 이미지에 대한 170만 개의 QA 쌍으로 구성되어 있으며, 이미지당 평균 17개의 질문이 있습니다.
시각적 질문 답변 데이터 세트와 비교했을 때, 시각적 게놈 데이터 세트는 무엇, 어디, 언제, 누구, 왜, 어떻게의 6가지 유형의 질문이 더 균형 있게 분포되어 있습니다. 또한 Visual Genome은 객체, 속성, 관계가 자세히 주석된 108,000개의 이미지를 제공합니다.
Visual_Genome_Dataset.torrent
시딩 1다운로드 중 1완료됨 591총 다운로드 횟수 865