HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 4 mois

L'approche NLP Farsi de CMU METAL

{Mehdi Manshadi Weston Feely Lori Levin Robert Frederking}

Résumé

Bien que de nombreux outils de haute qualité soient disponibles pour l’analyse des langues majeures telles que l’anglais, il est beaucoup plus difficile d’obtenir et d’intégrer des outils gratuits équivalents pour des langues importantes mais à faible ressource, comme le persan. Nous rapportons ici une interface d’analyse précise et efficace pour le persan, que nous avons conçue et mise en œuvre, et qui pourrait s’avérer utile à d’autres chercheurs souhaitant travailler sur le texte persan écrit. Les composants et ressources préexistants que nous avons intégrés incluent le TurboParser et le TurboTagger de l’Université Carnegie Mellon (Martins et al., 2010), entraînés sur le Dadegan Treebank (Rasooli et al., 2013), le normalisateur de texte persan de l’Université d’Uppsala, PrePer (Seraji, 2013), le tokeniseur persan d’Uppsala (Seraji et al., 2012a), ainsi que PerStem, développé par Jon Dehdari (Jadidinejad et al., 2010). L’ensemble de ces outils (combiné à des modules supplémentaires de normalisation et de tokenisation que nous avons développés et rendus accessibles) atteint un score de dépendance de 89,49 % en attachment étiqueté, 92,19 % en attachment non étiqueté et 91,38 % en précision des étiquettes sur un jeu de test de parsing indépendant. Tous les composants et ressources utilisés sont librement disponibles. En plus de décrire ces éléments, nous expliquons également la justification de nos choix.

Benchmarks

BenchmarkMéthodologieMétriques
dependency-parsing-on-100stlye-labellednlp
10°5 cm: nlp

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
L'approche NLP Farsi de CMU METAL | Articles de recherche | HyperAI