Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 7 Jahren

Größe

867.36 GB

Organisation

Veröffentlichungs-URL

looking-to-listen.github.io

Tags

Natürliche Sprachverarbeitung

AVSpeech ist ein neuer, groß angelegter audiovisueller Datensatz, der aus Videoclips von Sprache ohne störende Hintergrundgeräusche besteht. Die Clips sind zwischen 3 und 10 Sekunden lang und in jedem Clip gehört die im Soundtrack zu hörende Stimme der einzigen Person, die im Video sichtbar spricht. Der Datensatz enthält etwa 4.700 Stunden Videoclips aus 290.000 YouTube-Videos und deckt eine große Vielfalt an Personen, Sprachen und Gesichtshaltungen ab.

AVSpeech.torrent

Seeding 3Wird heruntergeladen 1Abgeschlossen 2,861Gesamtdownloads 4,571

AVSpeech/
- data.z01
  97.91 GB
- data.z02
  195.56 GB
- data.z03
  293.22 GB
- data.z04
  390.88 GB
- data.z05
  488.53 GB
- data.z06
  586.19 GB
- data.z07
  683.84 GB
- data.z08
  781.5 GB
- data.zip
  867.35 GB
- README.md
  1.17 KB
- README.txt
  2.34 KB
- download.sh
  867.35 GB
- avspeech_train.csv
  128.33 MB
- avspeech_train.part0.csv
  153.99 MB
- avspeech_train.part1.csv
  179.66 MB
- avspeech_train.part2.csv
  205.33 MB
- avspeech_train.part3.csv
  230.99 MB
- avspeech_train.part4.csv
  256.66 MB
- parallel-20190822.tar.bz2
  867.35 GB
- parallel-20190822.tar.bz2.sig
  867.35 GB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 7 Jahren

Größe

867.36 GB

Organisation

Veröffentlichungs-URL

looking-to-listen.github.io

Tags

Natürliche Sprachverarbeitung

AVSpeech ist ein neuer, groß angelegter audiovisueller Datensatz, der aus Videoclips von Sprache ohne störende Hintergrundgeräusche besteht. Die Clips sind zwischen 3 und 10 Sekunden lang und in jedem Clip gehört die im Soundtrack zu hörende Stimme der einzigen Person, die im Video sichtbar spricht. Der Datensatz enthält etwa 4.700 Stunden Videoclips aus 290.000 YouTube-Videos und deckt eine große Vielfalt an Personen, Sprachen und Gesichtshaltungen ab.

AVSpeech.torrent

Seeding 3Wird heruntergeladen 1Abgeschlossen 2,861Gesamtdownloads 4,571

AVSpeech/
- data.z01
  97.91 GB
- data.z02
  195.56 GB
- data.z03
  293.22 GB
- data.z04
  390.88 GB
- data.z05
  488.53 GB
- data.z06
  586.19 GB
- data.z07
  683.84 GB
- data.z08
  781.5 GB
- data.zip
  867.35 GB
- README.md
  1.17 KB
- README.txt
  2.34 KB
- download.sh
  867.35 GB
- avspeech_train.csv
  128.33 MB
- avspeech_train.part0.csv
  153.99 MB
- avspeech_train.part1.csv
  179.66 MB
- avspeech_train.part2.csv
  205.33 MB
- avspeech_train.part3.csv
  230.99 MB
- avspeech_train.part4.csv
  256.66 MB
- parallel-20190822.tar.bz2
  867.35 GB
- parallel-20190822.tar.bz2.sig
  867.35 GB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

AVSpeech – Audiovisueller Sprachdatensatz | Datensätze | HyperAI