Amélioration de la prédiction des quadruplets d’aspect et d’opinion par augmentation de données basée sur l’ordre des modèles

Récemment, la prédiction des quadruplets de sentiment par aspect (ASQP) est devenue une tâche populaire dans le domaine de l’analyse de sentiment au niveau de l’aspect. Les travaux antérieurs utilisent un modèle prédéfini pour reformuler la phrase d’origine en une séquence cible structurée, pouvant être facilement décodée en quadruplets de la forme (catégorie d’aspect, terme d’aspect, terme d’opinion, polarité du sentiment). Ce modèle intègre les quatre éléments dans un ordre fixe. Toutefois, nous observons que cette approche contredit la propriété d’ordre libre inhérente à la tâche ASQP, puisqu’il n’est pas nécessaire de fixer l’ordre du modèle tant que le quadruplet est correctement extrait. Inspirés par cette observation, nous étudions l’impact des différents ordres de modèle et constatons que certains ordres aident le modèle génératif à atteindre de meilleures performances. Il est supposé que des ordres différents offrent des perspectives variées sur le quadruplet. Par conséquent, nous proposons une méthode simple mais efficace pour identifier les ordres les plus appropriés, puis combiner plusieurs modèles optimaux comme une technique d’augmentation de données afin d’améliorer la tâche ASQP. Plus précisément, nous utilisons un modèle pré-entraîné sur langage pour sélectionner les ordres présentant une entropie minimale. En fine-tunant ce modèle pré-entraîné avec ces ordres de modèles, notre approche améliore significativement la performance de prédiction des quadruplets, surpassant de manière notable les méthodes de pointe, notamment dans des contextes à ressources limitées.