Visual Genome 是图像及图像内容语义信息相关数据集,相比于 ImageNet 图像标注数据集拥有更为丰富的语义信息,其被用于拓展基于图像及语义信息的人工智能应用中。
该数据集目前包含 108249 张图片、420 万条区域内容描述、170 万条图像内容问答、210 万条对象案例、180 万条属性以及 180 万条关系。
该数据集由斯坦福大学于 2015 年发布初版,并于 2016 年发布 1.2 版,2017 年发布 1.4 版。
2 做种 0 下载 912 已完成
文件名 | 大小 |
---|---|
README.md | 1 KB |
README.txt | 1 KB |
The Visual Genome Dataset v1.0 Metadata.txt | 794 B |
Visual Genome_Connecting Language and Vision Using Crowdsourced Dense Image Annotations.pdf | 7 MB |
attributes.json.zip | 79 MB |
image_data.json.zip | 1 MB |
images.zip | 9 GB |
images2.zip | 5 GB |
objects.json.zip | 69 MB |
qa_to_region_mapping.json.zip | 4 MB |
question_answers.json.zip | 23 MB |
region_descriptions.json.zip | 121 MB |
region_graphs.json.zip | 316 MB |
relationships.json.zip | 73 MB |
scene_graphs.json.zip | 108 MB |
synsets.json.zip | 581 KB |
samples_0.png | 532 KB |