HyperAIHyperAI

Command Palette

Search for a command to run...

Granite 4.0 1B Speech: Kompakt, mehrsprachig und für Edge-Geräte

IBM hat Granite 4.0 1B Speech vorgestellt, das neueste Mitglied seiner Sprachmodell-Reihe, das speziell für Unternehmenseinsätze auf gerätebeschränkten Endgeräten entwickelt wurde. Dieses kompakte Modell für automatische Spracherkennung (ASR) und bidirektionale Sprachübersetzung (AST) überzeugt durch eine effiziente Architektur und erweitert die Unterstützung für mehrere Sprachen. Im Vergleich zu seinem Vorgänger, dem granite-speech-3.3-2b, verfügt das neue Modell nur über die Hälfte der Parameter. Trotz dieser Reduzierung liefert es präzisere Transkriptionen in englischer Sprache und ermöglicht eine schnellere Inferenz durch speculative decoding. Die Sprachunterstützung wurde auf Englisch, Französisch, Deutsch, Spanisch, Portugiesisch und Japanisch ausgeweitet. Zwei wesentliche neue Funktionen, die auf häufige Community-Anfragen zurückgehen, sind die ASR-Unterstützung für Japanisch sowie die Möglichkeit zur Keyword-List-Biasing zur verbesserten Erkennung von Eigennamen und Akronyms. Die Leistungsfähigkeit des Modells wurde durch das Ranking auf Platz 1 des OpenASR-Leaderboards unter offenen Spracherkennungssystemen bestätigt. Obwohl es sich um ein kleines Modell handelt, erreicht Granite 4.0 1B Speech wettbewerbsfähige Ergebnisse bei Standard-Englisch-ASR-Benchmarks. Die Genauigkeit wird dabei anhand der Wortfehlerrate (WER) gemessen, die den Prozentsatz der falsch transkribierten Wörter angibt; ein niedrigerer Wert steht für höhere Präzision. Tests auf verschiedenen Datensätzen zeigen, dass das Modell bei deutlich geringerer Parameteranzahl vergleichbare WER-Werte erzielt wie größere Modelle. Das Modell wird unter der Apache 2.0-Lizenz veröffentlicht und verfügt über native Unterstützung in den Frameworks transformers und vLLM. Die Evaluierung umfasste eine breite Palette von ASR- und AST-Benchmarks für englische, mehrsprachige und Übersetzungsaufgaben. Die Ergebnisse belegen, dass die Leistungsfähigkeit der von vielen anderen Modellen mit größerer Parameteranzahl erreicht oder sogar übertroffen wird. Weitere Details zu Architektur, Trainingsdaten und Anwendungsbeispielen sind in der Modellspezifikation verfügbar. IBM empfiehlt für den produktiven Einsatz, der zusätzliche Risikodetektion erfordert, die Kombination mit Granite Guardian. Entwickler können das Modell nun direkt erproben.

Verwandte Links

Granite 4.0 1B Speech: Kompakt, mehrsprachig und für Edge-Geräte | Aktuelle Beiträge | HyperAI