il y a 9 jours
Différenciation entre les langues nordiques similaires
René Haas, Leon Derczynski

Résumé
L’identification automatique des langues constitue un problème difficile. Il est particulièrement ardu de distinguer entre des langues étroitement apparentées. Ce papier présente une approche fondée sur l’apprentissage automatique pour l’identification automatique des langues dans le contexte des langues nordiques, qui sont fréquemment mal classées par les outils actuels de pointe. Plus précisément, nous nous concentrons sur la discrimination entre six langues nordiques : le danois, le suédois, le norvégien (nynorsk), le norvégien (bokmål), le féroïen et l’islandais.