HyperAIHyperAI
vor 2 Monaten

Multi-Task-Lernen mit LLMs für die implizite Stimmungsanalyse: Automatisches Gewichtslernen auf Daten- und Aufgabenebene

Wenna Lai; Haoran Xie; Guandong Xu; Qing Li
Multi-Task-Lernen mit LLMs für die implizite Stimmungsanalyse: Automatisches Gewichtslernen auf Daten- und Aufgabenebene
Abstract

Die implizite Sentimentanalyse (ISA) stellt erhebliche Herausforderungen dar aufgrund der Abwesenheit von auffälligen Hinweiswörtern. Vorherige Methoden gerieten ins Stocken, da sie mit unzureichenden Daten und begrenzten Schlussfolgerungsfähigkeiten konfrontiert waren, um die zugrunde liegenden Meinungen zu erkennen. Die Integration von Multi-Task-Lernen (MTL) mit großen Sprachmodellen (LLMs) bietet das Potenzial, Modellen unterschiedlicher Größen zu ermöglichen, in der ISA verlässlich echte Meinungen wahrzunehmen und zu erkennen. Allerdings sind bestehende MTL-Ansätze durch zwei Quellen von Unsicherheiten eingeschränkt: datenbezogene Unsicherheiten, die sich aus Halluzinationsproblemen in vom LLM generierten kontextuellen Informationen ergeben, und aufgabenspezifische Unsicherheiten, die auf die unterschiedlichen Fähigkeiten der Modelle zur Verarbeitung von Kontextinformationen zurückzuführen sind. Um diese Unsicherheiten zu bewältigen, stellen wir MT-ISA vor, einen neuen MTL-Rahmen, der die ISA durch den Einsatz der Generierungs- und Schlussfolgerungsfähigkeiten von LLMs verbessert. Insbesondere konstruiert MT-ISA Nebenaufgaben mithilfe generativer LLMs, um Sentimentelemente zu ergänzen, und integriert automatisches MTL, um das Nebendatenpotential vollständig auszuschöpfen. Wir führen datenbezogenes und aufgabenspezifisches automatisches Gewichtslernen (AWL) ein, das Beziehungen dynamisch identifiziert und verlässlichere Daten sowie kritische Aufgaben priorisiert. Dies ermöglicht es Modellen unterschiedlicher Größen, feingranulare Gewichte anhand ihrer Schlussfolgerungsfähigkeiten anpassbar zu lernen. Wir untersuchen drei Strategien für datenbezogenes AWL und führen zudem homoskedastische Unsicherheit für aufgabenspezifisches AWL ein. Ausführliche Experimente zeigen, dass Modelle unterschiedlicher Größen in MT-ISA eine optimale Balance zwischen Hauptvorhersage und Nebenaufgaben erreichen. Dies unterstreicht die Effektivität und Anpassungsfähigkeit unseres Ansatzes.