HyperAIHyperAI
il y a 17 jours

Bases de transfert profond pour l'analyse d'opinion en russe

{Mikhail Komarov, Sergey Smetanin}
Résumé

Récemment, l’apprentissage par transfert à partir de modèles linguistiques préentraînés s’est avéré efficace dans diverses tâches de traitement du langage naturel, y compris l’analyse d’opinion. Ce papier vise à identifier des bases d’apprentissage par transfert profond pour l’analyse d’opinion en russe. Tout d’abord, nous avons identifié les jeux de données les plus utilisés publiquement pour l’analyse d’opinion en russe, ainsi que les récents modèles linguistiques prenant officiellement en charge la langue russe. Ensuite, nous avons finement ajusté Multilingual Bidirectional Encoder Representations from Transformers (BERT), RuBERT, ainsi que deux versions du Multilingual Universal Sentence Encoder, obtenant ainsi des résultats remarquables, voire nouveaux, d’état de l’art sur sept jeux de données d’analyse d’opinion en russe : SentRuEval-2016, SentiRuEval-2015, RuTweetCorp, RuSentiment, LINIS Crowd, Kaggle Russian News Dataset et RuReviews. Enfin, nous avons mis à disposition publiquement les modèles finement ajustés pour la communauté de recherche.