HyperAI

Ensemble De Données De Flux De Travail Scientifique MASSW

Date

il y a 6 mois

Taille

998.33 MB

Organisation

URL de publication

github.com

L'ensemble de données MASSW (Multi-Aspect Summarization of Scientific Workflows) est un ensemble de données textuelles complet axé sur la synthèse de plusieurs aspects des flux de travail scientifiques. Il a été publié conjointement en 2024 par des chercheurs de l'Université du Michigan, d'Ann Arbor, de l'Université Purdue et du LG AI Research Institute. Les résultats de l’article connexe sont «MASSW : un nouvel ensemble de données et des tâches de référence pour les flux de travail scientifiques assistés par l'IA".

MASSW contient plus de 152 000 publications évaluées par des pairs provenant de 17 grandes conférences en informatique, couvrant les 50 dernières années. La caractéristique principale de cet ensemble de données est qu’il définit cinq aspects clés du flux de travail scientifique : le contexte, les idées clés, les méthodes, les résultats et l’impact escompté. Ces aspects ont été utilisés pour extraire et structurer les informations de chaque publication, générant ainsi un résumé structuré. Ce processus améliore non seulement l’accessibilité de l’information, mais facilite également diverses tâches et analyses en aval.

MASSW.torrent
Partage 1Téléchargement 1Terminés 54Téléchargements totaux 57
  • MASSW/
    • README.md
      1.69 KB
    • README.txt
      3.39 KB
      • data/
          • MASSW/
            • massw_metadata_v1.jsonl
              854.73 MB
            • massw_v1.tsv
              998.33 MB