HyperAIHyperAI
vor 2 Monaten

Ein sequenz-basiertes Ansatz für die Dokumentenebene-Relationsextraktion

John Giorgi; Gary D. Bader; Bo Wang
Ein sequenz-basiertes Ansatz für die Dokumentenebene-Relationsextraktion
Abstract

Motiviert durch die Tatsache, dass viele Relationen den Satzrand überschreiten, hat sich das Interesse an der Dokumentebenen-Relationsextraktion (DocRE) in letzter Zeit gesteigert. DocRE erfordert die Integration von Informationen innerhalb und zwischen Sätzen sowie die Erfassung komplexer Wechselwirkungen zwischen Erwähnungen von Entitäten. Die meisten bestehenden Methoden sind pipelinenbasiert und benötigen Entitäten als Eingabe. Allerdings kann das gemeinsame Lernen zur Extraktion von Entitäten und Relationen aufgrund geteilter Parameter und Trainingsprozesse die Leistung verbessern und effizienter sein. In dieser Arbeit entwickeln wir einen sequenzbasierten Ansatz, seq2rel, der die Teilprobleme der DocRE (Entitätserkennung, Coreferenzauflösung und Relationsextraktion) end-to-end lernen kann und somit eine Reihe von taskspezifischen Komponenten ersetzt. Mit einer einfachen Strategie, die wir „Entitätshinweise“ nennen, vergleichen wir unseren Ansatz mit existierenden pipelinenbasierten Methoden auf mehreren gängigen biomedizinischen Datensätzen, wobei wir in einigen Fällen ihre Leistung übertrifft. Wir melden auch die ersten end-to-end Ergebnisse auf diesen Datensätzen für zukünftige Vergleiche. Schließlich zeigen wir, dass unser Modell einen end-to-end Ansatz gegenüber einem pipelinenbasierten Ansatz überlegen ist. Unser Code, unsere Daten und trainierte Modelle sind unter {\url{https://github.com/johngiorgi/seq2rel}} verfügbar. Eine Online-Demo ist unter {\url{https://share.streamlit.io/johngiorgi/seq2rel/main/demo.py}} zu finden.

Ein sequenz-basiertes Ansatz für die Dokumentenebene-Relationsextraktion | Neueste Forschungsarbeiten | HyperAI