HyperAIHyperAI
vor 2 Monaten

Ein einzelnes tiefes bidirektionales LSTM-Netzwerk für die Wortsinnentambiguierung von Textdaten

Ahmad Pesaranghader; Ali Pesaranghader; Stan Matwin; Marina Sokolova
Ein einzelnes tiefes bidirektionales LSTM-Netzwerk für die Wortsinnentambiguierung von Textdaten
Abstract

Aufgrund neuer technischer und wissenschaftlicher Fortschritte verfügen wir über eine Fülle von Informationen, die in unstrukturierten Textdaten wie Offline-/Online-Narrativen, Forschungsartikeln und klinischen Berichten verborgen sind. Um diese Daten angemessen zu analysieren, kann ein Algorithmus zur Wortsinndiskriminierung (Word Sense Disambiguation, WSD) zahlreiche Schwierigkeiten im Prozess der Natürlichen Sprachverarbeitung (Natural Language Processing, NLP) vermeiden, die auf deren inhärenter Mehrdeutigkeit beruhen. Allerdings können bei der großen Anzahl an mehrdeutigen Wörtern in einer Sprache oder einem technischen Bereich erhebliche Einschränkungen für die ordnungsgemäße Implementierung bestehender WSD-Modelle auftreten. In dieser Arbeit wird das Problem der einen-Klassifikator-pro-einem-Wort-WSD-Algorithmen durch den Vorschlag eines einzigen Bidirektionalen Langzeit-kurzzeit-Gedächtnisses (Bidirectional Long Short-Term Memory, BLSTM)-Netzes angegangen, das durch die Berücksichtigung von Bedeutungen und Kontextsequenzen kollektiv auf alle mehrdeutigen Wörter arbeitet. Anhand des Benchmarks SensEval-3 zeigen wir, dass die Ergebnisse unseres Modells mit denen der besten WSD-Algorithmen vergleichbar sind. Darüber hinaus diskutieren wir, wie zusätzliche Modifikationen die Modellfehler reduzieren und den Bedarf an mehr Trainingsdaten verringern.

Ein einzelnes tiefes bidirektionales LSTM-Netzwerk für die Wortsinnentambiguierung von Textdaten | Neueste Forschungsarbeiten | HyperAI