Date

il y a 2 ans

Taille

34.77 GB

Organisation

URL de publication

source.plus

URL du document

arxiv.org

Balises

Classification D'images

Public Domain 12M (PD12M en abrégé) est un ensemble de données image-texte à grande échelle créé par Spawning en 2024. Il contient 12,4 millions d'images de haute qualité sous licence du domaine public et CC0 avec des légendes synthétiques, qui sont principalement utilisées pour former des modèles texte-image. PD12M est actuellement le plus grand ensemble de données d'images et de textes du domaine public. Grâce à son ampleur considérable et à ses déclarations de droits d’auteur claires, il fournit une base solide pour la formation des modèles d’IA tout en minimisant les problèmes de droits d’auteur. Les résultats pertinents de l'article sontDomaine public 12M : un ensemble de données image-texte hautement esthétique avec de nouveaux mécanismes de gouvernance". Les sources de données de PD12M comprennent des galeries, des bibliothèques, des archives, des musées (GLAM) et Wikimedia Commons, et la qualité et la sécurité des données sont assurées par un examen et une gouvernance minutieux. Le processus de construction de l'ensemble de données couvre plusieurs étapes allant de la collecte d'images, de la vérification des droits d'auteur, du téléchargement d'images, du filtrage du contenu à la génération de légendes. PD12M a également introduit un mécanisme de gouvernance des données axé sur la communauté via la plateforme Source.Plus pour soutenir l'amélioration continue et la maintenance de l'ensemble de données. De plus, PD12M dispose d'une large gamme d'applications, principalement utilisées pour former et évaluer des modèles de génération de texte en image, visant à promouvoir le développement de la vision par ordinateur et du traitement du langage naturel. Cet ensemble de données fournit non seulement de riches ressources de formation pour le domaine de l'IA, mais constitue également un exemple de pratiques d'IA responsables et favorise la protection et l'utilisation des ressources publiques d'IA.

PD12M.torrent

Partage 1Téléchargement 0Terminé 174Total des téléchargements 267

PD12M/
- README.md
  2.02 KB
- README.txt
  4.05 KB

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données

Discuter sur Discord

Date

il y a 2 ans

Taille

34.77 GB

Organisation

URL de publication

source.plus

URL du document

arxiv.org

Balises

Classification D'images

PD12M.torrent

Partage 1Téléchargement 0Terminé 174Total des téléchargements 267

PD12M/
- README.md
  2.02 KB
- README.txt
  4.05 KB

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

il y a 2 mois

Ensemble De Données Du Problème d'inférence Open-RL

il y a 4 mois

Jeu De Données De Jeu De Voiture Avec Gestes De La Main Étiquetés

il y a 5 mois

Ensemble De Données Sur Les Émotions Du Visage Humain

il y a 3 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données image-texte À Grande Échelle PD12M

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données image-texte À Grande Échelle PD12M

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Ensemble De Données Du Problème d'inférence Open-RL

Jeu De Données De Jeu De Voiture Avec Gestes De La Main Étiquetés

Ensemble De Données Sur Les Émotions Du Visage Humain

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données image-texte À Grande Échelle PD12M

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Ensemble De Données Du Problème d'inférence Open-RL

Jeu De Données De Jeu De Voiture Avec Gestes De La Main Étiquetés

Ensemble De Données Sur Les Émotions Du Visage Humain

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Ensemble De Données Du Problème d'inférence Open-RL

Jeu De Données De Jeu De Voiture Avec Gestes De La Main Étiquetés

Ensemble De Données Sur Les Émotions Du Visage Humain

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Ensemble De Données Du Problème d'inférence Open-RL

Jeu De Données De Jeu De Voiture Avec Gestes De La Main Étiquetés

Ensemble De Données Sur Les Émotions Du Visage Humain