HyperAIHyperAI

Command Palette

Search for a command to run...

vor 2 Monaten

EchoX: Eine Annäherung an die Reduzierung der akustisch-semantischen Lücke durch Echotrainings für Sprache-zu-Sprache-LLMs

Yuhao Zhang Yuhao Du Zhanchen Dai Xiangnan Ma Kaiqi Kou Benyou Wang Haizhou Li

EchoX: Eine Annäherung an die Reduzierung der akustisch-semantischen Lücke durch Echotrainings für Sprache-zu-Sprache-LLMs

Abstract

Sprach-zu-Sprache- große Sprachmodelle (SLLM) erregen zunehmend Aufmerksamkeit. Aufbauend auf textbasierten großen Sprachmodellen (LLM) weisen SLLM häufig eine Verschlechterung in Wissens- und Schlussfolgerungsfähigkeiten auf. Wir vermuten, dass dieser Limitierung zugrunde liegt, dass die derzeitigen Trainingsparadigmen für SLLM die akustisch-semantische Lücke im Merkmalsrepräsentationsraum nicht überbrücken. Um dieses Problem zu lösen, schlagen wir EchoX vor, das semantische Repräsentationen nutzt und dynamisch Sprachtrainingsziele generiert. Dieser Ansatz integriert sowohl akustisches als auch semantisches Lernen und ermöglicht es EchoX, starke Schlussfolgerungsfähigkeiten als Sprachmodell zu bewahren. Experimentelle Ergebnisse zeigen, dass EchoX mit etwa sechstausend Stunden Trainingsdaten eine herausragende Leistung auf mehreren wissensbasierten Frage-Antwort-Benchmarks erzielt. Das Projekt ist unter https://github.com/FreedomIntelligence/EchoX verfügbar.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
EchoX: Eine Annäherung an die Reduzierung der akustisch-semantischen Lücke durch Echotrainings für Sprache-zu-Sprache-LLMs | Forschungsarbeiten | HyperAI