Datum

vor 2 Jahren

Größe

34.77 GB

Organisation

Veröffentlichungs-URL

source.plus

Paper-URL

arxiv.org

Tags

Bildklassifikation

Public Domain 12M (kurz PD12M) ist ein umfangreicher Bild-Text-Datensatz, der 2024 von Spawning erstellt wurde. Er enthält 12,4 Millionen hochwertige, gemeinfreie und unter CC0 lizenzierte Bilder mit synthetischen Bildunterschriften, die hauptsächlich zum Trainieren von Text-zu-Bild-Modellen verwendet werden. PD12M ist derzeit der größte gemeinfreie Bild-Text-Datensatz. Mit seinem enormen Umfang und den klaren Urheberrechtserklärungen bietet es eine solide Grundlage für das Training von KI-Modellen und minimiert gleichzeitig Urheberrechtsbedenken. Die relevanten Papierergebnisse sindPublic Domain 12M: Ein hochästhetischer Bild-Text-Datensatz mit neuartigen Governance-Mechanismen". Zu den Datenquellen von PD12M gehören Galerien, Bibliotheken, Archive, Museen (GLAM) und Wikimedia Commons. Die Qualität und Sicherheit der Daten werden durch sorgfältige Prüfung und Verwaltung gewährleistet. Der Prozess der Datensatzerstellung umfasst mehrere Schritte, von der Bildsammlung, Urheberrechtsprüfung, dem Bilddownload, der Inhaltsfilterung bis hin zur Untertitelgenerierung. PD12M hat außerdem über die Source.Plus-Plattform einen Community-gesteuerten Datenverwaltungsmechanismus eingeführt, um die kontinuierliche Verbesserung und Wartung des Datensatzes zu unterstützen. Darüber hinaus verfügt PD12M über ein breites Anwendungsspektrum, das hauptsächlich zum Trainieren und Bewerten von Text-zu-Bild-Generierungsmodellen verwendet wird, mit dem Ziel, die Entwicklung der Computervision und der Verarbeitung natürlicher Sprache zu fördern. Dieser Datensatz bietet nicht nur umfangreiche Schulungsressourcen für den KI-Bereich, sondern ist auch ein Beispiel für verantwortungsvolle KI-Praktiken und fördert den Schutz und die Nutzung öffentlicher KI-Ressourcen.

PD12M.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 174Gesamtdownloads 267

PD12M/
- README.md
  2.02 KB
- README.txt
  4.05 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 2 Jahren

Größe

34.77 GB

Organisation

Veröffentlichungs-URL

source.plus

Paper-URL

arxiv.org

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

vor 2 Monaten

Open-RL Inferenzproblem-Datensatz

vor 4 Monaten

Handgesten-Datensatz Für Das Autospiel

vor 5 Monaten

Datensatz Menschlicher Gesichtsausdrücke

vor 3 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

PD12M Großer Bild-Text-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

PD12M Großer Bild-Text-Datensatz

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Open-RL Inferenzproblem-Datensatz

Handgesten-Datensatz Für Das Autospiel

Datensatz Menschlicher Gesichtsausdrücke

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

PD12M Großer Bild-Text-Datensatz

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Open-RL Inferenzproblem-Datensatz

Handgesten-Datensatz Für Das Autospiel

Datensatz Menschlicher Gesichtsausdrücke

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Open-RL Inferenzproblem-Datensatz

Handgesten-Datensatz Für Das Autospiel

Datensatz Menschlicher Gesichtsausdrücke

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Open-RL Inferenzproblem-Datensatz

Handgesten-Datensatz Für Das Autospiel

Datensatz Menschlicher Gesichtsausdrücke