OceanInstruct 是一个专为海洋科学领域设计的大型语言模型指令数据集,包含 20,000 条指令,旨在为海洋领域的大型语言模型提供训练数据。这些指令覆盖了广泛的海洋科学知识,确保模型在海洋科学问答、内容生成和水下具身智能能力等方面具备专业能力。该数据集被用于训练 OceanGPT 模型,该模型在海洋科学问答、内容生成等方面表现出色。 OceanGPT 模型在多个任务上优于基线语言模型,显示出其在处理需要专业知识的海洋任务上的优势。
该数据集是浙江大学于 2024 年开源,相关论文成果为「OceanGPT: A Large Language Model for Ocean Science Tasks」。
超神经报道地址为「入选 ACL 2024!浙大推出首个海洋大语言模型 OceanGPT,水下具身智能成现实」。
此外,与 OceanBench 一同提出的还有 OceanBench 海洋学基准测试评估数据集,这是一个专门针对海洋学任务的基准测试评估数据集。这个数据集总共包括 15 种与海洋相关的任务,例如问答和描述任务,旨在全面评估大型语言模型 (LLM) 在海洋学领域的能力。 OceanBench 中的样本是通过自动化的方式从种子数据集生成,并经过专家的人工验证,以确保数据的专业性和准确性。
做种 1
下载中 0
已完成 32
总下载 81