Ensemble De Données De Paires image-texte RedCaps
Date
Taille
URL de publication
URL de l'article
Licence
Autre

RedCaps est un ensemble de données de paires image-texte à grande échelle avec un total de 1,2 million de données provenant de Reddit. Les images et le texte décrivent une variété d’objets et de scènes.
Les données ont été collectées à partir d'un ensemble de subreddits organisés par des humains qui fournissaient des étiquettes d'images grossières et permettaient de guider l'assemblage de l'ensemble de données sans étiqueter les instances individuelles.
L’équipe de l’Université du Michigan a publié l’ensemble de données.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.