Command Palette
Search for a command to run...
AVSpeech – Audiovisueller Sprachdatensatz
Date
Size
Publish URL
AVSpeech ist ein neuer, groß angelegter audiovisueller Datensatz, der aus Videoclips von Sprache ohne störende Hintergrundgeräusche besteht. Die Clips sind zwischen 3 und 10 Sekunden lang und in jedem Clip gehört die im Soundtrack zu hörende Stimme der einzigen Person, die im Video sichtbar spricht.
Der Datensatz enthält etwa 4.700 Stunden Videoclips aus 290.000 YouTube-Videos und deckt eine große Vielfalt an Personen, Sprachen und Gesichtshaltungen ab.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.