このデータセットを使用

Discordで議論

日付

2年前

サイズ

2.41 MB

データセット構成

公開URL

omni-math.github.io

Paper URL

タグ

ディープラーニング

ベンチマーク

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。

Omni-MATH は、オリンピックレベルの数学的問題に対する大規模言語モデル (LLM) のパフォーマンスを評価するために、北京大学と Alibaba によって作成されたオリンピックレベルの数学的推論ベンチマークデータセットです。関連する論文結果は「Omni-MATH: 大規模な言語モデルのための世界オリンピックレベルの数学ベンチマーク”。このデータセットには、厳密に手動で注釈が付けられた競技レベルの数学問題 4,428 個が含まれており、オリンピック準備レベルから、IMO (国際数学オリンピック)、IMC (国際数学) などのオリンピックのトップクラスの数学競技まで、33 のサブフィールドと 10 以上の異なる難易度をカバーしています。コンペティション）、パトナム数学コンペティションなど。 Omni-MATH の作成プロセスには、世界的な数学コンテストからデータを収集し、データの高品質と多様性を確保するために人による注釈を介して検証することが含まれます。データセットの構築中に、研究チームは GPT-4o を使用して問題を分類し、異なる数学分野に分割して、さまざまな数学分野でのモデルのパフォーマンスを評価しました。

Omni-MATH.torrent

シーディング 1ダウンロード中 0完了 152総ダウンロード数 251

Omni-MATH/
- README.md
  1.73 KB
- README.txt
  3.46 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

このデータセットを使用

Discordで議論

日付

2年前

サイズ

2.41 MB

データセット構成

公開URL

omni-math.github.io

Paper URL

arxiv.org

タグ

ディープラーニング

ベンチマーク

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。

Omni-MATH は、オリンピックレベルの数学的問題に対する大規模言語モデル (LLM) のパフォーマンスを評価するために、北京大学と Alibaba によって作成されたオリンピックレベルの数学的推論ベンチマークデータセットです。関連する論文結果は「Omni-MATH: 大規模な言語モデルのための世界オリンピックレベルの数学ベンチマーク”。このデータセットには、厳密に手動で注釈が付けられた競技レベルの数学問題 4,428 個が含まれており、オリンピック準備レベルから、IMO (国際数学オリンピック)、IMC (国際数学) などのオリンピックのトップクラスの数学競技まで、33 のサブフィールドと 10 以上の異なる難易度をカバーしています。コンペティション）、パトナム数学コンペティションなど。 Omni-MATH の作成プロセスには、世界的な数学コンテストからデータを収集し、データの高品質と多様性を確保するために人による注釈を介して検証することが含まれます。データセットの構築中に、研究チームは GPT-4o を使用して問題を分類し、異なる数学分野に分割して、さまざまな数学分野でのモデルのパフォーマンスを評価しました。

Omni-MATH.torrent

シーディング 1ダウンロード中 0完了 152総ダウンロード数 251

Omni-MATH/
- README.md
  1.73 KB
- README.txt
  3.46 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています