HyperAI超神経

MMMLU 多言語マルチタスク言語理解データセット

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください

Multilingual Massive Multitask Language Understanding (MMMLU) データセットは、さまざまな言語、認知、文化的コンテキストにおける人工知能モデルのパフォーマンスを評価および改善するために、2024 年に OpenAI によって開始されたオープンソース データセットです。 MMMLU は、大規模なマルチタスク言語理解 (MMLU) ベンチマークに基づいて構築されており、初歩的な知識から法律、物理学、歴史、コンピューティング科学に至るまで、57 の異なる主題分野のタスクが含まれています。およびその他の高度な専門科目。

研究チームはプロの人間翻訳者を使用して、MMLU のテストセットを 14 の言語に翻訳しました。この評価を人間の翻訳者に依存すると、特にヨルバ語などのリソースが少ない言語の場合、翻訳の精度に対する信頼が高まります。 MMMLU は、プロの翻訳者による翻訳を通じて、言語を越えたタスクにおける AI モデルの機能を評価するために重要なデータセットの正確性と信頼性を保証します。

MMMLU の主な機能には、多言語評価、マルチタスク習熟度テスト、異文化理解、モデルの多様性の促進、研究開発のサポートなどが含まれます。技術原則には、データセットの構築、専門的な翻訳、多言語サポート、評価ツールの開発、パフォーマンス分析が含まれます。

MMMLU の応用シナリオには、言語モデル評価、機械翻訳システム、異文化コミュニケーション、教育テクノロジー、国際ビジネスなどが含まれます。データ セットのリリースは、自然言語処理 (NLP) 研究の分野に大きな影響を与えるでしょう。MMMLU は、理論的探求と実用的なアプリケーション開発の両方に重要なリソース サポートを提供します。

MMMLU.torrent
シーディング 2ダウンロード中 0ダウンロード完了 63総ダウンロード数 201
  • MMMLU/
    • README.md
      2.19 KB
    • README.txt
      4.38 KB
      • data/
        • MMMLU.zip
          31.05 MB