vor 9 Tagen
Unterscheidung zwischen ähnlichen nordischen Sprachen
René Haas, Leon Derczynski

Abstract
Die automatische Spracherkennung stellt eine herausfordernde Aufgabe dar. Die Unterscheidung zwischen eng verwandten Sprachen ist dabei besonders schwierig. In diesem Beitrag wird ein maschinelles Lernverfahren für die automatische Spracherkennung der nordischen Sprachen vorgestellt, die häufig fälschlicherweise kategorisiert werden, wenn bestehende state-of-the-art-Tools eingesetzt werden. Konkret wird die Unterscheidung zwischen sechs nordischen Sprachen betrachtet: Dänisch, Schwedisch, Norwegisch (Nynorsk), Norwegisch (Bokmål), Färöisch und Isländisch.