HyperAIHyperAI

Command Palette

Search for a command to run...

OBELICS : Un jeu de données filtré à l'échelle du web de documents image-texte entrelacés

Résumé

Les grands modèles multimodaux formés sur des documents naturels, qui alternent images et texte, surpassent les modèles formés sur des paires image-texte sur diverses évaluations multimodales. Cependant, les ensembles de données utilisés pour former ces modèles n'ont pas été rendus publics, et le processus de collecte n'a pas été entièrement spécifié. Nous présentons le jeu de données OBELICS, un ensemble de données filtré à l'échelle du web et ouvert, composé de 141 millions de pages web extraites de Common Crawl, 353 millions d'images associées et 115 milliards de jetons textuels. Nous décrivons le processus de création du jeu de données, présentons des règles de filtrage exhaustives et fournissons une analyse du contenu du jeu de données. Pour démontrer la viabilité d'OBELICS, nous avons formé des modèles visuels et linguistiques dotés respectivement de 9 et 80 milliards de paramètres nommés IDEFICS, et obtenu des performances compétitives sur différentes évaluations multimodales. Nous mettons à disposition notre jeu de données, nos modèles et notre code.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
OBELICS : Un jeu de données filtré à l'échelle du web de documents image-texte entrelacés | Articles | HyperAI