Ein verbessertes spanbasiertes Zerlegungsverfahren für Few-Shot-Sequenzmarkierung

Few-Shot Sequence Labeling (FSSL) ist ein etablierter Ansatz für Tagging-Modelle, beispielsweise Named Entity Recognition und Slot Filling, um auf neu auftretenden, ressourcenscharfen Domänen generalisieren zu können. In jüngster Zeit wurde der metrikbasierte Meta-Learning-Ansatz als vielversprechender Ansatz für FSSL erkannt. Allerdings weisen die meisten vorherigen Arbeiten eine Label-Zuweisung auf Token-Ebene basierend auf Token-ähnlichkeitsbetrachtungen auf, wodurch die Integrität von benannten Entitäten oder Slots vernachlässigt wird. Um dies zu beheben, schlagen wir in diesem Artikel ESD, eine verbesserte span-basierte Dekompositionsmethode für FSSL, vor. ESD formuliert FSSL als ein Spann-Ebene-Übereinstimmungsproblem zwischen Test-Abfragen und unterstützenden Instanzen. Insbesondere zerlegt ESD das Spann-Übereinstimmungsproblem in eine Reihe von spanbasierten Schritten, hauptsächlich bestehend aus verbesserter Spann-Repräsentation, Aggregation von Klassen-Prototypen sowie der Lösung von Spann-Konflikten. Umfangreiche Experimente zeigen, dass ESD auf zwei etablierten FSSL-Benchmarks, FewNERD und SNIPS, die neuen SOTA-Ergebnisse erzielt und sich in Szenarien mit verschachtelten und verrauschten Tags als robuster erweist. Unser Code ist unter https://github.com/Wangpeiyi9979/ESD verfügbar.