MASSW 科学的ワークフロー データセット

MASSW (科学的ワークフローの多面的要約) データ セットは、科学的ワークフローの多面的要約に焦点を当てた包括的なテキスト データ セットであり、ミシガン大学、アナーバー大学、パデュー大学、および米国科学研究所の LG 研究者によって開発されました。人工知能は 2024 年に共同で発表し、関連する論文結果は「MASSW: AI 支援科学ワークフローのための新しいデータセットとベンチマーク タスク”。

MASSW には、過去 50 年間をカバーする 17 の主要なコンピューター サイエンス会議からの 152,000 を超える査読済み出版物が含まれています。このデータセットの中核的な特徴は、科学ワークフローの 5 つの主要な側面 (コンテキスト、主要なアイデア、手法、結果、予想される影響) を定義していることです。これらの側面は、各出版物から情報を抽出して構造化し、構造化された概要を作成するために使用されました。このプロセスにより、情報へのアクセスが向上するだけでなく、下流のさまざまなタスクや分析も容易になります。

MASSW.torrent

做种 1

下载中 0

已完成 6

总下载 8

  • MASSW/
    • README.md
      1.69 KB
    • README.txt
      3.39 KB
      • data/
          • MASSW/
            • massw_metadata_v1.jsonl
              854.73 MB
            • massw_v1.tsv
              998.33 MB