HyperAIHyperAI
vor 11 Tagen

ConSeC: Wortbedeutungsauflösung als kontinuierliche Sinnzusammenfassung

{Roberto Navigli, Luigi Procopio, Edoardo Barba}
ConSeC: Wortbedeutungsauflösung als kontinuierliche Sinnzusammenfassung
Abstract

Überwachte Systeme sind heute zum Standardansatz für die Wortsinndisambiguierung (Word Sense Disambiguation, WSD) geworden, wobei Sprachmodelle auf Basis von Transformers als zentrale Komponente dienen. Trotz ihrer beeindruckenden Leistungsfähigkeit unterliegen praktisch alle dieser Systeme einer einschränkenden Annahme: Gegeben ein Kontext, wird jeder Worttoken individuell disambiguiert, ohne Berücksichtigung der Sinnschätzungen benachbarter Wörter. Um diese Einschränkung zu überwinden und die Annahme aufzugeben, schlagen wir CONtinuous SEnse Comprehension (ConSeC) vor – einen neuartigen Ansatz zur WSD. Ausgehend von einer kürzlich vorgeschlagenen Neubewertung der Aufgabe als Textextraktionsproblem, adaptieren wir diese Formulierung für unseren Ansatz und führen eine Rückkopplungsstrategie ein, die es ermöglicht, die Disambiguierung eines Zielsymbols nicht nur auf dessen Kontext, sondern auch auf die explizit zugewiesenen Sinne benachbarter Wörter zu bedingen. Wir evaluieren ConSeC und analysieren, wie dessen Komponenten dazu beitragen, alle bisherigen Ansätze zu übertreffen und eine neue State-of-the-Art-Leistung auf dem Gebiet der englischen WSD zu erzielen. Zudem untersuchen wir die Leistung von ConSeC im mehrsprachigen Kontext, wobei wir acht Sprachen mit unterschiedlichem Grad an verfügbaren Ressourcen betrachten, und berichten über signifikante Verbesserungen gegenüber vorhergehenden Systemen. Unsere Implementierung ist unter https://github.com/SapienzaNLP/consec öffentlich verfügbar.

ConSeC: Wortbedeutungsauflösung als kontinuierliche Sinnzusammenfassung | Neueste Forschungsarbeiten | HyperAI