CitePrompt: Verwendung von Prompts zur Identifizierung der Zitierabsicht in wissenschaftlichen Arbeiten

Zitate in wissenschaftlichen Publikationen helfen uns nicht nur, die intellektuelle Abstammung zu verfolgen, sondern sind auch ein nützlicher Indikator für die wissenschaftliche Bedeutung der Arbeit. Zitierintentionen erweisen sich als vorteilhaft, da sie die Rolle des Zitats in einem bestimmten Kontext spezifizieren. In dieser Arbeit stellen wir CitePrompt vor, einen Rahmen, der den bisher unerforschten Ansatz des prompt-basierten Lernens für die Klassifikation von Zitierintentionen nutzt. Wir argumentieren, dass mit der richtigen Wahl des vortrainierten Sprachmodells, des Prompt-Vorlagen und des Prompt-Verbalisators nicht nur Ergebnisse erzielt werden können, die besser oder vergleichbar mit denen der neuesten Methoden sind, sondern dies auch mit viel weniger externen Informationen über das wissenschaftliche Dokument erreicht werden kann. Wir berichten über neueste Ergebnisse auf dem ACL-ARC-Datensatz und zeigen zudem eine signifikante Verbesserung auf dem SciCite-Datensatz im Vergleich zu allen Baseline-Modellen außer einem. Da geeignete große annotierte Datensätze für die Klassifikation von Zitierintentionen sehr schwer zu finden sein können, schlagen wir erstmals die Umwandlung dieser Aufgabe in Few-Shot- und Zero-Shot-Einstellungen vor. Für den ACL-ARC-Datensatz melden wir einen F1-Score von 53,86 % für die Zero-Shot-Einstellung, der bei den 5-Shot- und 10-Shot-Einstellungen auf 63,61 % und 66,99 % verbessert wird.请注意,我在翻译中保留了“CitePrompt”、“ACL-ARC”和“SciCite”这些专有名词的英文形式,因为它们通常是国际上通用的技术术语或数据集名称。如果您希望对这些名称进行本地化,请告知我具体的翻译要求。