Date

il y a 2 ans

Taille

104.46 GB

Organisation

URL de publication

github.com

Balises

Texte Vers Image

COYO-700M est un grand ensemble de données contenant 747 millions de paires image-texte ainsi que de nombreux autres méta-attributs pour améliorer la convivialité pour la formation de divers modèles. Cet ensemble de données suit une stratégie similaire à celle des ensembles de données de vision et de langage précédents, en collectant de nombreuses paires de textes alternatifs informatifs dans des documents HTML et leurs images associées.

Processus de collecte de données

D'octobre 2020 à août 2021, l'équipe de recherche a collecté environ 10 milliards de paires de sources alternatives de texte et d'image dans des documents HTML dans CommonCrawl et a éliminé les paires non informatives avec un coût minimal grâce à un processus de filtrage aux niveaux de l'image et du texte. La figure décrit le processus de collecte de données de l’équipe de recherche.

coyo-700m.torrent

Seeding 1Téléchargement 0Terminé 171Total Downloads 378

coyo-700m/
- README.md
  1.32 KB
- README.txt
  2.63 KB

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données

Discuter sur Discord

Date

il y a 2 ans

Taille

104.46 GB

Organisation

URL de publication

github.com

Balises

Texte Vers Image

Processus de collecte de données

coyo-700m.torrent

Seeding 1Téléchargement 0Terminé 171Total Downloads 378

coyo-700m/
- README.md
  1.32 KB
- README.txt
  2.63 KB

undefined

Ensemble De Données Cliniques Sur Le Cancer Du Poumon

il y a 2 mois

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

il y a 5 mois

Données Sur La Qualité De l'air (IQA) De La Pollution À Delhi

il y a 5 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données De Paires image-texte COYO-700M

Processus de collecte de données

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Paires image-texte COYO-700M

Processus de collecte de données

undefined

Ensemble De Données Cliniques Sur Le Cancer Du Poumon

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Données Sur La Qualité De l'air (IQA) De La Pollution À Delhi

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Paires image-texte COYO-700M

Processus de collecte de données

undefined

Ensemble De Données Cliniques Sur Le Cancer Du Poumon

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Données Sur La Qualité De l'air (IQA) De La Pollution À Delhi

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données Cliniques Sur Le Cancer Du Poumon

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Données Sur La Qualité De l'air (IQA) De La Pollution À Delhi

undefined

Ensemble De Données Cliniques Sur Le Cancer Du Poumon

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Données Sur La Qualité De l'air (IQA) De La Pollution À Delhi