日期

2 年前

大小

31.05 MB

数据集组织

标签

LLM

自然语言处理

语言

多语言大规模多任务语言理解 (MMMLU) 数据集是由 OpenAI 于 2024 年推出的一个开源数据集，旨在评估和提升人工智能模型在不同语言、认知和文化背景下的性能。 MMMLU 建立在大规模多任务语言理解 (MMLU) 基准的基础上，是人工智能模型所达到的常识性指标，包含 57 个不同学科领域的任务，涵盖了从初级知识到法律、物理、历史和计算机科学等高级专业学科。

研究团队使用专业的人工翻译将 MMLU 的测试集翻译成 14 种语言。依靠人工翻译进行此次评估可以提高对翻译准确性的信心，尤其是对于资源匮乏的语言（如约鲁巴语）。通过专业翻译人员进行翻译，MMMLU 能确保数据集的准确性和可靠性，这对于评估 AI 模型在跨语言任务中的能力至关重要。 MMMLU 的主要功能包括多语言评估、多任务能力测试、跨文化理解、提升模型多样性和支持研究和开发。技术原理包括数据集构建、专业翻译、多语言支持、评估工具开发和性能分析。 MMMLU 的应用场景包括语言模型评估、机器翻译系统、跨文化交流、教育技术和国际化业务。数据集的发布，将会在自然语言处理 (NLP) 研究领域引发深远的影响，无论是对于理论的探索还是实际应用的开发，MMMLU 都提供了重要的资源支持。

MMMLU.torrent

做种 1正在下载 0已完成 236总下载量 429

MMMLU/
- README.md
  2.19 KB
- README.txt
  4.38 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集

在 Discord 上讨论

日期

2 年前

大小

31.05 MB

数据集组织

标签

LLM

自然语言处理

语言

多语言大规模多任务语言理解 (MMMLU) 数据集是由 OpenAI 于 2024 年推出的一个开源数据集，旨在评估和提升人工智能模型在不同语言、认知和文化背景下的性能。 MMMLU 建立在大规模多任务语言理解 (MMLU) 基准的基础上，是人工智能模型所达到的常识性指标，包含 57 个不同学科领域的任务，涵盖了从初级知识到法律、物理、历史和计算机科学等高级专业学科。

MMMLU.torrent

做种 1正在下载 0已完成 236总下载量 429

MMMLU/
- README.md
  2.19 KB
- README.txt
  4.38 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集

在 Discord 上讨论

日期

2 年前

大小

31.05 MB

数据集组织

标签

LLM

自然语言处理

语言

多语言大规模多任务语言理解 (MMMLU) 数据集是由 OpenAI 于 2024 年推出的一个开源数据集，旨在评估和提升人工智能模型在不同语言、认知和文化背景下的性能。 MMMLU 建立在大规模多任务语言理解 (MMLU) 基准的基础上，是人工智能模型所达到的常识性指标，包含 57 个不同学科领域的任务，涵盖了从初级知识到法律、物理、历史和计算机科学等高级专业学科。

MMMLU.torrent

做种 1正在下载 0已完成 236总下载量 429

MMMLU/
- README.md
  2.19 KB
- README.txt
  4.38 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

GroundingME 复杂场景理解评测数据集

5 个月前

MCIF 多模态跨语言指令跟随数据集

5 个月前

TxT360-3efforts 多任务推理数据集

5 个月前

LongBench-Pro 长上下文综合评测数据集

5 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

MMMLU 多语言多任务语言理解数据集 | 数据集 | HyperAI超神经

用 AI 构建 AI

HyperAI Newsletters

相关数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

LongBench-Pro 长上下文综合评测数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

LongBench-Pro 长上下文综合评测数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

LongBench-Pro 长上下文综合评测数据集

相关数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

LongBench-Pro 长上下文综合评测数据集

Command Palette

MMMLU 多语言多任务语言理解数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

MMMLU 多语言多任务语言理解数据集

相关数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

LongBench-Pro 长上下文综合评测数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

MMMLU 多语言多任务语言理解数据集

相关数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

LongBench-Pro 长上下文综合评测数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

LongBench-Pro 长上下文综合评测数据集

相关数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

LongBench-Pro 长上下文综合评测数据集