AVSpeech – Audiovisueller Sprachdatensatz
Datum
vor 6 Jahren
Größe
867.36 GB
Veröffentlichungs-URL
AVSpeech ist ein neuer, groß angelegter audiovisueller Datensatz, der aus Videoclips von Sprache ohne störende Hintergrundgeräusche besteht. Die Clips sind zwischen 3 und 10 Sekunden lang und in jedem Clip gehört die im Soundtrack zu hörende Stimme der einzigen Person, die im Video sichtbar spricht.
Der Datensatz enthält etwa 4.700 Stunden Videoclips aus 290.000 YouTube-Videos und deckt eine große Vielfalt an Personen, Sprachen und Gesichtshaltungen ab.
AVSpeech.torrent
Seeding 3Herunterladen 0Abgeschlossen 2,819Gesamtdownloads 4,253
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.
KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Hyper Newsletters
Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp