MASSW Wissenschaftlicher Workflow-Datensatz
Datum
Größe
Veröffentlichungs-URL
Kategorien
Der MASSW-Datensatz (Multi-Aspect Summarization of Scientific Workflows) ist ein umfassender Textdatensatz, der sich auf die Zusammenfassung mehrerer Aspekte wissenschaftlicher Arbeitsabläufe konzentriert. Es wurde 2024 gemeinsam von Forschern der University of Michigan, Ann Arbor, der Purdue University und des LG AI Research Institute veröffentlicht. Die entsprechenden Ergebnisse der Studie sind „MASSW: Ein neuer Datensatz und Benchmark-Aufgaben für KI-gestützte wissenschaftliche Arbeitsabläufe".
MASSW enthält mehr als 152.000 von Experten begutachtete Veröffentlichungen von 17 führenden Informatikkonferenzen aus den letzten 50 Jahren. Das Kernmerkmal dieses Datensatzes besteht darin, dass er fünf Schlüsselaspekte des wissenschaftlichen Arbeitsablaufs definiert: Kontext, Schlüsselideen, Methoden, Ergebnisse und beabsichtigte Wirkung. Diese Aspekte wurden verwendet, um Informationen aus jeder Veröffentlichung zu extrahieren und zu strukturieren und so eine strukturierte Zusammenfassung zu erstellen. Dieser Prozess verbessert nicht nur die Zugänglichkeit von Informationen, sondern erleichtert auch verschiedene nachgelagerte Aufgaben und Analysen.