MASSW (Multi-Aspect Summarization of Scientific Workflows) 数据集是一个专注于科学工作流程多方面总结的综合文本数据集,是由密歇根大学 (University of Michigan, Ann Arbor) 、普渡大学 (Purdue University) 和 LG 人工智能研究所的研究人员于 2024 年共同发布,相关论文成果为「MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows」。
MASSW 包含了超过 152k 篇来自 17 个顶级计算机科学会议的同行评审出版物,这些数据覆盖了过去 50 年的时间跨度。该数据集的核心特点在于它定义了科学工作流的 5 个关键方面:上下文、关键思想、方法、结果和预期影响。这些方面被用来从每篇出版物中提取和结构化信息,从而生成结构化的总结。这一过程不仅提高了信息的可访问性,还为各种下游任务和分析提供了便利。
做种 1
下载中 0
已完成 7
总下载 8