OceanInstruct 海洋大模型指令数据集

日期

5 个月前

大小

2.89 MB

机构

Zhejiang University

发布地址

github.com

特色图像

OceanInstruct 是一个专为海洋科学领域设计的大型语言模型指令数据集,包含 20,000 条指令,旨在为海洋领域的大型语言模型提供训练数据。这些指令覆盖了广泛的海洋科学知识,确保模型在海洋科学问答、内容生成和水下具身智能能力等方面具备专业能力。该数据集被用于训练 OceanGPT 模型,该模型在海洋科学问答、内容生成等方面表现出色。 OceanGPT 模型在多个任务上优于基线语言模型,显示出其在处理需要专业知识的海洋任务上的优势。

该数据集是浙江大学于 2024 年开源,相关论文成果为「OceanGPT: A Large Language Model for Ocean Science Tasks」。

超神经报道地址为「入选 ACL 2024!浙大推出首个海洋大语言模型 OceanGPT,水下具身智能成现实」。

此外,与 OceanBench 一同提出的还有 OceanBench 海洋学基准测试评估数据集,这是一个专门针对海洋学任务的基准测试评估数据集。这个数据集总共包括 15 种与海洋相关的任务,例如问答和描述任务,旨在全面评估大型语言模型 (LLM) 在海洋学领域的能力。 OceanBench 中的样本是通过自动化的方式从种子数据集生成,并经过专家的人工验证,以确保数据的专业性和准确性。

OceanInstruct.torrent

做种 1

下载中 0

已完成 33

总下载 95

  • OceanInstruct/
    • README.md
      1.48 KB
    • README.txt
      2.96 KB
      • data/
        • oceaninstruct.zip
          2.89 MB