Ein Prism-Modul für die semantische Entkoppelung in der Namenerkennung

Natürliche Sprachverarbeitung hat sich seit vielen Jahren mit dem Problem auseinandergesetzt, dass innerhalb eines Wortes mehrere Semantiken vermischt sind, selbst unter Berücksichtigung des Kontextes. Um dieses Problem zu lösen, schlagen wir ein Prismenmodul vor, das die semantischen Aspekte von Wörtern entkoppelt und Rauschen auf der Eingabeschicht eines Modells reduziert. Im Prismenmodul werden bestimmte Wörter selektiv durch themenbezogene semantische Aspekte ersetzt; anschließend können diese gereinigten Wortrepräsentationen in nachgeschaltete Aufgaben eingespeist werden, wodurch diese vereinfacht werden. Darüber hinaus führen wir eine Struktur ein, um dieses Modul gemeinsam mit dem nachgeschalteten Modell ohne zusätzliche Daten zu trainieren. Das Modul lässt sich problemlos in das nachgeschaltete Modell integrieren und verbessert die Leistung von Baseline-Modellen erheblich bei der Aufgabe der Namensentitätserkennung (Named Entity Recognition, NER). Die Ablationsanalyse belegt die Plausibilität der vorgeschlagenen Methode. Als Nebeneffekt bietet das Verfahren zudem eine Möglichkeit, den Beitrag jedes einzelnen Wortes visuell darzustellen.