MASSW 科学工作流程数据集

日期

1 个月前

大小

998.33 MB

机构

发布地址

github.com

MASSW (Multi-Aspect Summarization of Scientific Workflows) 数据集是一个专注于科学工作流程多方面总结的综合文本数据集,是由密歇根大学 (University of Michigan, Ann Arbor) 、普渡大学 (Purdue University) 和 LG 人工智能研究所的研究人员于 2024 年共同发布,相关论文成果为「MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows」。

MASSW 包含了超过 152k 篇来自 17 个顶级计算机科学会议的同行评审出版物,这些数据覆盖了过去 50 年的时间跨度。该数据集的核心特点在于它定义了科学工作流的 5 个关键方面:上下文、关键思想、方法、结果和预期影响。这些方面被用来从每篇出版物中提取和结构化信息,从而生成结构化的总结。这一过程不仅提高了信息的可访问性,还为各种下游任务和分析提供了便利。

MASSW.torrent

做种 1

下载中 0

已完成 7

总下载 8

  • MASSW/
    • README.md
      1.69 KB
    • README.txt
      3.39 KB
      • data/
          • MASSW/
            • massw_metadata_v1.jsonl
              854.73 MB
            • massw_v1.tsv
              998.33 MB