HyperAIHyperAI

Command Palette

Search for a command to run...

Datensatz „Einfache Sprachfragen“

Datum

vor 12 Stunden

Organisation

Google

Lizenz

CC BY 4.0

Simple Voice Questions (SVQ) ist ein von Google veröffentlichter kurzer Audiodatensatz und ein zentraler Bestandteil der Evaluierung des Massive Sound Embedding Benchmark (MSEB). Dieser mehrsprachige Sprachdatensatz enthält kurze Audiofragen in 17 Sprachen aus 26 Regionen mit insgesamt ca. 700 Sprechern. Jeder Sprecher lieferte bis zu 250 Sprachproben, darunter Arabisch, Englisch, Japanisch, Koreanisch und Hindi. Die Aufnahmen umfassen verschiedene Umgebungsbedingungen wie ruhige Umgebungen, Hintergrundgeräusche und Verkehrslärm. Die Daten sind nach dem Geschlecht der Sprecher kategorisiert (weiblich, männlich, nicht-binär, keine Angabe) und zeigen somit eine hohe Diversität sowohl in sprachlicher als auch in akustischer Hinsicht.

Datenfelder:

  • utt_id: Eine Zeichenkette, die eine eindeutige Kennung für die Aufnahme darstellt.
  • Wellenform: Audiotyp, Abtastrate 16.000.
  • locale: Eine Zeichenkette, die die Aufnahmeregion repräsentiert.
  • speaker_id: Eine Zeichenkette, die eine eindeutige Kennung für den Sprecher darstellt.
  • speaker_age: Eine 32-Bit-Ganzzahl, die das Alter des Sprechers repräsentiert.
  • speaker_gender: Eine Zeichenkette, die das Geschlecht des Sprechers repräsentiert.
  • Umgebung: Eine Zeichenkette, die die Aufnahmeumgebung repräsentiert.
  • text: Ein String-Typ, der den aufgezeichneten Textinhalt repräsentiert.
  • topk_salient_terms: Eine Liste von Zeichenketten, die Schlüsselwörter darstellen.
  • topk_salient_terms_timestamps: Eine Liste von Gleitkommazahlen, die die Zeitstempel der Schlüsselwörter darstellen.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp