vor 8 Monaten

Alexander Polok Jiangyu Han Dominik Klement Samuele Cornell Jan \u010cernock\u00fd Luk\u00e1\u0161 Burget

Zusammenfassung

Wir präsentieren ein automatisches Spracherkennungssystem (ASR) für zwei Sprecher, das DiCoW – eine diarisierungsbedingte Variante von Whisper – mit DiariZen kombiniert, einer auf Pyannote basierenden Diarisierungspipeline. Zunächst bewerten wir beide Systeme in außerdomänen (OOD) multilingualen Szenarien ohne jede Feinabstimmung. In diesem Szenario übertrifft DiariZen konsistent das Baseline-Diarisierungsmodell von Pyannote und zeigt starke Generalisierungsfähigkeiten. Trotz der Feinabstimmung anhand englischsprachiger Daten für die Ziel-Sprecher-ASR behält DiCoW eine solide multilinguale Leistung, was darauf hinweist, dass die Encoder-Modifikationen Whispers multilinguale Fähigkeiten erhalten. Anschließend führen wir eine Feinabstimmung sowohl von DiCoW als auch von DiariZen an den Daten des MLC-SLM-Challenges durch. Das feinabgestimmte DiariZen übertrifft weiterhin das feinabgestimmte Pyannote-Baseline-Modell, während DiCoW zusätzliche Verbesserungen durch die Domänenanpassung erzielt. Unser endgültiges System erreicht einen mikro-durchschnittlichen tcpWER/CER-Wert von 16,75 % und belegt den zweiten Platz in Aufgabe 2 des MLC-SLM-Challenges. Schließlich identifizieren wir mehrere Beschriftungsinkonsistenzen in den Trainingsdaten – wie fehlende Sprachsegmente und falsche Stillschweigeannotierungen –, die die Feinabstimmung der Diarisierung behindern können. Wir schlagen einfache Maßnahmen zur Behebung dieser Probleme vor, um die Robustheit des Systems zu verbessern.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Audio- Und Sprachverarbeitung

Alexander Polok Jiangyu Han Dominik Klement Samuele Cornell Jan \u010cernock\u00fd Luk\u00e1\u0161 Burget

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Audio- Und Sprachverarbeitung

Alexander Polok Jiangyu Han Dominik Klement Samuele Cornell Jan \u010cernock\u00fd Luk\u00e1\u0161 Burget

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

BUT-System für die MLC-SLM-Herausforderung

Alexander Polok Jiangyu Han Dominik Klement Samuele Cornell Jan \u010cernock\u00fd Luk\u00e1\u0161 Burget

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

BUT-System für die MLC-SLM-Herausforderung

Alexander Polok Jiangyu Han Dominik Klement Samuele Cornell Jan \u010cernock\u00fd Luk\u00e1\u0161 Burget

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

BUT-System für die MLC-SLM-Herausforderung

Alexander Polok Jiangyu Han Dominik Klement Samuele Cornell Jan \u010cernock\u00fd Luk\u00e1\u0161 Burget

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters