HyperAIHyperAI

Ensemble De Données De Paires image-texte CC12M

Date

il y a 3 ans

Organisation

Recherche Google

URL de publication

github.com

URL de l'article

arxiv.org

Licence

其他

Aide au téléchargement
特色图像

CC12M (Conceptual 12M) est un ensemble de données de paires image-texte spécialement conçu pour la pré-formation de la vision et du langage. L'ensemble de données contient 12 millions de paires image-texte. Comparé à CC3M, cet ensemble de données est plus performant en matière de reconnaissance visuelle à longue traîne pour plusieurs tâches en aval.

Ensemble De Données De Paires image-texte CC12M | Ensembles de données | HyperAI