DiffusionNER: Randdiffusion für die Erkennung benannter Entitäten

In dieser Arbeit schlagen wir DiffusionNER vor, eine Methode, die die Aufgabe der Named-Entity-Erkennung (NER) als Randentrauschungs-Diffusionsprozess formuliert und dadurch benannte Entitäten aus verrauschten Bereichen generiert. Während des Trainings fügt DiffusionNER allmählich Rauschen zu den goldenen Entitätsrändern durch einen festgelegten Vorwärtsdiffusionsprozess hinzu und lernt einen Rückwärtsdiffusionsprozess, um diese Ränder wiederherzustellen. Bei der Inferenz zieht DiffusionNER zunächst zufällig einige verrauschte Bereiche aus einer Standard-Gaußverteilung und generiert dann die benannten Entitäten, indem es sie mit dem gelernten Rückwärtsdiffusionsprozess entrauscht. Der vorgeschlagene Randentrauschungs-Diffusionsprozess ermöglicht fortschreitende Verfeinerung und dynamisches Sampling von Entitäten, was DiffusionNER mit effizienter und flexibler Entitätsgenerierungskapazität ausstattet. Experimente auf mehreren flachen und verschachtelten NER-Datensätzen zeigen, dass DiffusionNER vergleichbare oder sogar bessere Leistungen als bisherige state-of-the-art-Modelle erzielt.