HyperAIHyperAI
vor 11 Tagen

SANDWiCH: Semantische Analyse von Nachbarn zur Entstörung von Wörtern im Kontext ad hoc

Guzman-Olivares, Daniel, Quijano-Sanchez, Lara, Liberatore, Federico
SANDWiCH: Semantische Analyse von Nachbarn zur Entstörung von Wörtern im Kontext ad hoc
Abstract

Die rasante Entwicklung generativer, chatbasierten großen Sprachmodelle (Large Language Models, LLMs) in den letzten zwei Jahren hat einen Wettlauf um die Entwicklung von Systemen ausgelöst, die nahezu menschenähnliche Gespräche und Schlussfolgerungsfähigkeiten versprechen. Doch aktuelle Studien zeigen, dass das Sprachverständnis dieser Modelle weiterhin begrenzt bleibt und weit entfernt von menschlichem Leistungslevel ist, insbesondere hinsichtlich der Erfassung kontextueller Bedeutungen von Wörtern – eines entscheidenden Aspekts für kognitive Schlussfolgerungen. In diesem Artikel präsentieren wir einen einfachen, aber recheneffizienten Ansatz für die mehrsprachige Wortbedeutungsdisambiguierung (Word Sense Disambiguation, WSD). Unser Ansatz formuliert die WSD-Aufgabe neu als Cluster-Differenzierungsanalyse innerhalb eines semantischen Netzwerks, das mittels Gruppenalgebra aus BabelNet verfeinert wurde. Wir validieren unsere Methode an mehreren WSD-Benchmark-Datenbanken und erreichen dabei einen neuen Meilenstein für alle Sprachen und Aufgaben sowie bei Einzelbewertungen nach Wortarten. Insbesondere übertrifft unser Modell die Leistung aktueller Alternativen signifikant, selbst in sprachlich wenig ressourcenstarken Sprachen, während die Anzahl der Parameter um 72 % reduziert wird.

SANDWiCH: Semantische Analyse von Nachbarn zur Entstörung von Wörtern im Kontext ad hoc | Neueste Forschungsarbeiten | HyperAI