HyperAIHyperAI
vor 9 Tagen

Eine Nachbildung von Apple’s bidirektionalen LSTM-Modellen zur Spracherkennung in kurzen Zeichenketten

Mads Toftrup, Søren Asger Sørensen, Manuel R. Ciosici, Ira Assent
Eine Nachbildung von Apple’s bidirektionalen LSTM-Modellen zur Spracherkennung in kurzen Zeichenketten
Abstract

Sprachidentifikation ist die Aufgabe, die Sprache eines Dokuments zu bestimmen. Für Anwendungen wie die automatische Auswahl eines Rechtschreibprüfers muss die Sprachidentifikation sehr kurze Zeichenfolgen, beispielsweise Textnachrichtenfragmente, verarbeiten können. In dieser Arbeit reproduzieren wir eine Sprachidentifikationsarchitektur, die Apple in einem Blogbeitrag kurz skizziert hat. Wir bestätigen die Leistungsfähigkeit des bi-LSTM-Modells und stellen fest, dass es aktuelle Open-Source-Sprachidentifikatoren übertrifft. Zudem stellen wir fest, dass die Fehlidentifikationen des Modells auf Verwechslungen zwischen verwandten Sprachen zurückzuführen sind.