Ensemble De Données Du Génome Visuel V1.2 Ensemble De Données De Compréhension Sémantique D'images À Grande Échelle
Date
Taille
URL de publication
* Cet ensemble de données prend en charge l'utilisation en ligne.Cliquez ici pour sauter.
Visual Genome est un ensemble de données liées aux informations sémantiques des images et du contenu des images. Comparé à l'ensemble de données d'annotation d'images ImageNet, il dispose d'informations sémantiques plus riches. Il est utilisé pour étendre les applications d’intelligence artificielle basées sur des images et des informations sémantiques.
L'ensemble de données contient actuellement 108 249 images, 4,2 millions de descriptions de contenu de région, 1,7 million de questions et réponses sur le contenu d'image, 2,1 millions de cas d'objets, 1,8 million d'attributs et 1,8 million de relations.
L'ensemble de données a été publié pour la première fois par l'Université de Stanford en 2015, la version 1.2 a été publiée en 2016 et la version 1.4 a été publiée en 2017.