Ein Datensatz für die Extraktion n-ärer Beziehungen von Medikamentenkombinationen

Kombinations-Therapien sind inzwischen der Standard bei Krankheiten wie Krebs, Tuberkulose, Malaria und HIV. Die Vielzahl der verfügbaren Mehrfach-Medikamenten-Therapien stellt jedoch eine Herausforderung dar, um effektive Kombinations-Therapien in einer bestimmten Situation zu identifizieren. Um medizinischen Fachkräften bei der Identifikation vorteilhafter Medikamentenkombinationen zu helfen, erstellen wir ein von Experten annotiertes Datensatz, um Informationen über die Wirksamkeit von Medikamentenkombinationen aus wissenschaftlichen Publikationen zu extrahieren. Neben seiner praktischen Nutzen bietet dieser Datensatz auch eine einzigartige NLP-Herausforderung dar, da es sich um den ersten Relationsextraktions-Datensatz mit variabler Länge der Relationen handelt. Zudem erfordern die Relationen in diesem Datensatz hauptsächlich ein Sprachverständnis über Satzgrenzen hinweg, was die Schwierigkeit dieser Aufgabe weiter erhöht. Wir stellen ein vielversprechendes Baseline-Modell bereit und identifizieren klare Bereiche für weitere Verbesserungen. Unser Datensatz, unser Code und unsere Baseline-Modelle werden öffentlich veröffentlicht, um die NLP-Gemeinschaft dazu zu ermutigen, an dieser Aufgabe mitzuwirken.请注意,这里有一些小的调整以适应德语的语法和表达习惯,例如“Combination therapies”被翻译为“Kombinations-Therapien”,“expert-annotated dataset”被翻译为“von Experten annotiertes Datensatz”。同时,“NLP”在德语中通常也使用英文缩写,因此保留了原样。希望这能符合您的要求。