HyperAI

MASSW Wissenschaftlicher Workflow-Datensatz

Datum

vor 6 Monaten

Größe

998.33 MB

Organisation

Veröffentlichungs-URL

github.com

Der MASSW-Datensatz (Multi-Aspect Summarization of Scientific Workflows) ist ein umfassender Textdatensatz, der sich auf die Zusammenfassung mehrerer Aspekte wissenschaftlicher Arbeitsabläufe konzentriert. Es wurde 2024 gemeinsam von Forschern der University of Michigan, Ann Arbor, der Purdue University und des LG AI Research Institute veröffentlicht. Die entsprechenden Ergebnisse der Studie sind „MASSW: Ein neuer Datensatz und Benchmark-Aufgaben für KI-gestützte wissenschaftliche Arbeitsabläufe".

MASSW enthält mehr als 152.000 von Experten begutachtete Veröffentlichungen von 17 führenden Informatikkonferenzen aus den letzten 50 Jahren. Das Kernmerkmal dieses Datensatzes besteht darin, dass er fünf Schlüsselaspekte des wissenschaftlichen Arbeitsablaufs definiert: Kontext, Schlüsselideen, Methoden, Ergebnisse und beabsichtigte Wirkung. Diese Aspekte wurden verwendet, um Informationen aus jeder Veröffentlichung zu extrahieren und zu strukturieren und so eine strukturierte Zusammenfassung zu erstellen. Dieser Prozess verbessert nicht nur die Zugänglichkeit von Informationen, sondern erleichtert auch verschiedene nachgelagerte Aufgaben und Analysen.

MASSW.torrent
Seeding 1Herunterladen 1Abgeschlossen 54Gesamtdownloads 57
  • MASSW/
    • README.md
      1.69 KB
    • README.txt
      3.39 KB
      • data/
          • MASSW/
            • massw_metadata_v1.jsonl
              854.73 MB
            • massw_v1.tsv
              998.33 MB