Scribosermo: Schnelle Sprache-zu-Text-Modelle für Deutsch und andere Sprachen

Rezenten Sprache-zu-Text-Modellen werden oft große Hardware-Ressourcen benötigt und sind überwiegend auf Englisch trainiert. In dieser Arbeit werden Sprache-zu-Text-Modelle für Deutsch, Spanisch und Französisch vorgestellt, die über besondere Eigenschaften verfügen: (a) Sie sind klein und laufen in Echtzeit auf Mikrocontrollern wie dem Raspberry Pi. (b) Unter Verwendung eines vortrainierten englischen Modells können sie auf Hardware für den Endverbraucher mit einem vergleichsweise kleinen Datensatz trainiert werden. (c) Die Modelle sind wettbewerbsfähig gegenüber anderen Lösungen und übertrumpfen diese insbesondere im Deutschen. In diesem Sinne kombinieren die Modelle Vorteile verschiedener Ansätze, die jeweils nur einen Teil der vorgestellten Merkmale aufweisen. Darüber hinaus stellt der Artikel eine neue Bibliothek zur Datenverarbeitung vor, die darauf abzielt, leicht durch zusätzliche Datensätze erweiterbar zu sein, und zeigt eine optimierte Methode für das Transferlernen neuer Sprachen mittels eines vortrainierten Modells einer anderen Sprache mit ähnlicher Alphabetisierung.