日付

2年前

サイズ

31.05 MB

データセット構成

タグ

LLM

自然言語処理

言語

Multilingual Massive Multitask Language Understanding (MMMLU) データセットは、さまざまな言語、認知、文化的コンテキストにおける人工知能モデルのパフォーマンスを評価および改善するために、2024 年に OpenAI によって開始されたオープンソースデータセットです。 MMMLU は、大規模なマルチタスク言語理解 (MMLU) ベンチマークに基づいて構築されており、初歩的な知識から法律、物理学、歴史、コンピューティング科学に至るまで、57 の異なる主題分野のタスクが含まれています。およびその他の高度な専門科目。

研究チームはプロの人間翻訳者を使用して、MMLU のテストセットを 14 の言語に翻訳しました。この評価を人間の翻訳者に依存すると、特にヨルバ語などのリソースが少ない言語の場合、翻訳の精度に対する信頼が高まります。 MMMLU は、プロの翻訳者による翻訳を通じて、言語を越えたタスクにおける AI モデルの機能を評価するために重要なデータセットの正確性と信頼性を保証します。 MMMLU の主な機能には、多言語評価、マルチタスク習熟度テスト、異文化理解、モデルの多様性の促進、研究開発のサポートなどが含まれます。技術原則には、データセットの構築、専門的な翻訳、多言語サポート、評価ツールの開発、パフォーマンス分析が含まれます。 MMMLU の応用シナリオには、言語モデル評価、機械翻訳システム、異文化コミュニケーション、教育テクノロジー、国際ビジネスなどが含まれます。データセットのリリースは、自然言語処理 (NLP) 研究の分野に大きな影響を与えるでしょう。MMMLU は、理論的探求と実用的なアプリケーション開発の両方に重要なリソースサポートを提供します。

MMMLU.torrent

シーディング 1ダウンロード中 0完了 236総ダウンロード数 429

MMMLU/
- README.md
  2.19 KB
- README.txt
  4.38 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

2年前

サイズ

31.05 MB

データセット構成

タグ

LLM

自然言語処理

言語

Multilingual Massive Multitask Language Understanding (MMMLU) データセットは、さまざまな言語、認知、文化的コンテキストにおける人工知能モデルのパフォーマンスを評価および改善するために、2024 年に OpenAI によって開始されたオープンソースデータセットです。 MMMLU は、大規模なマルチタスク言語理解 (MMLU) ベンチマークに基づいて構築されており、初歩的な知識から法律、物理学、歴史、コンピューティング科学に至るまで、57 の異なる主題分野のタスクが含まれています。およびその他の高度な専門科目。

MMMLU.torrent

シーディング 1ダウンロード中 0完了 236総ダウンロード数 429

MMMLU/
- README.md
  2.19 KB
- README.txt
  4.38 KB

GroundingME 複雑シーン理解評価データセット

5ヶ月前

MCIFマルチモーダルクロスランゲージ指導データセット

5ヶ月前

TxT360-3efforts マルチタスク推論データセット

5ヶ月前

LongBench-Pro ロングコンテキスト包括的評価データセット

5ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

AIでAIを構築

HyperAI Newsletters

関連データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

関連データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

Command Palette

MMMLU 多言語マルチタスク言語理解データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

MMMLU 多言語マルチタスク言語理解データセット

関連データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

MMMLU 多言語マルチタスク言語理解データセット

関連データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

関連データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット