AVSpeech – Audiovisueller Sprachdatensatz
Datum
vor 6 Jahren
Größe
867.36 GB
Veröffentlichungs-URL
Kategorien
AVSpeech ist ein neuer, groß angelegter audiovisueller Datensatz, der aus Videoclips von Sprache ohne störende Hintergrundgeräusche besteht. Die Clips sind zwischen 3 und 10 Sekunden lang und in jedem Clip gehört die im Soundtrack zu hörende Stimme der einzigen Person, die im Video sichtbar spricht.
Der Datensatz enthält etwa 4.700 Stunden Videoclips aus 290.000 YouTube-Videos und deckt eine große Vielfalt an Personen, Sprachen und Gesichtshaltungen ab.
AVSpeech.torrent
Seeding 3Herunterladen 2Abgeschlossen 2,322Gesamtdownloads 3,810