HyperAIHyperAI

MASSW Wissenschaftlicher Workflow-Datensatz

Datum

vor 10 Monaten

Größe

998.33 MB

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

Der MASSW-Datensatz (Multi-Aspect Summarization of Scientific Workflows) ist ein umfassender Textdatensatz, der sich auf die Zusammenfassung mehrerer Aspekte wissenschaftlicher Arbeitsabläufe konzentriert. Es wurde 2024 gemeinsam von Forschern der University of Michigan, Ann Arbor, der Purdue University und des LG AI Research Institute veröffentlicht. Die entsprechenden Ergebnisse der Studie sind „MASSW: Ein neuer Datensatz und Benchmark-Aufgaben für KI-gestützte wissenschaftliche Arbeitsabläufe".

MASSW enthält mehr als 152.000 von Experten begutachtete Veröffentlichungen von 17 führenden Informatikkonferenzen aus den letzten 50 Jahren. Das Kernmerkmal dieses Datensatzes besteht darin, dass er fünf Schlüsselaspekte des wissenschaftlichen Arbeitsablaufs definiert: Kontext, Schlüsselideen, Methoden, Ergebnisse und beabsichtigte Wirkung. Diese Aspekte wurden verwendet, um Informationen aus jeder Veröffentlichung zu extrahieren und zu strukturieren und so eine strukturierte Zusammenfassung zu erstellen. Dieser Prozess verbessert nicht nur die Zugänglichkeit von Informationen, sondern erleichtert auch verschiedene nachgelagerte Aufgaben und Analysen.

MASSW.torrent
Seeding 1Herunterladen 0Abgeschlossen 117Gesamtdownloads 157
  • MASSW/
    • README.md
      1.69 KB
    • README.txt
      3.39 KB
      • data/
          • MASSW/
            • massw_metadata_v1.jsonl
              854.73 MB
            • massw_v1.tsv
              998.33 MB
MASSW Wissenschaftlicher Workflow-Datensatz | Datensätze | HyperAI