日付

2年前

サイズ

1.11 MB

データセット構成

公開URL

Paper URL

タグ

OceanBench は、2024 年に浙江大学の Zhang Ningyu 氏と Chen Huajun 氏のチームによって設計された海洋ミッションに特化して設計されたベンチマーク評価データセットです。このデータセットには、質問応答タスクや説明タスクなど、合計 15 の海洋関連タスクが含まれており、海洋学の分野における大規模言語モデル (LLM) の機能を包括的に評価するように設計されています。 OceanBench のサンプルはシードデータセットから自動的に生成され、データの専門性と正確性を確保するために専門家によって手動で検証されます。 OceanBench は、海洋学の分野で大規模な言語モデルの開発を促進し、標準化されたテストプラットフォームを提供し、研究者が海洋科学のタスクにおけるモデルの理解を深め、パフォーマンスを向上できるようにするために作成されました。このベンチマークを通じて、研究者は、海洋物理学、海洋化学、海洋生物学、地質学、水文学、その他の分野における質問応答や説明生成タスクを含むがこれらに限定されない、海洋科学のさまざまなサブタスクにおけるモデルの機能を評価できます。さらに、OceanBench とともに提案されているのは、 OceanInstruct海洋大型モデル命令データセット、これは海洋科学の分野向けに特別に設計された大規模な言語モデルの命令データセットであり、20,000 の命令が含まれており、海洋分野の大規模な言語モデルのトレーニングデータを提供するように設計されています。これらの指示は海洋科学の幅広い知識をカバーしており、モデルが海洋科学の質問と回答、コンテンツ生成、および水中で具現化されたインテリジェンス機能における専門的な機能を備えていることを保証します。このデータセットは、海洋科学の質問応答やコンテンツ生成で優れたパフォーマンスを発揮する OceanGPT モデルのトレーニングに使用されます。

OceanBenchDataset.torrent

シーディング 1ダウンロード中 0完了 207総ダウンロード数 341

OceanBenchDataset/
- README.md
  2.15 KB
- README.txt
  4.3 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

ダウンロード

Discordで議論

日付

2年前

サイズ

1.11 MB

データセット構成

公開URL

Paper URL

タグ

OceanBenchDataset.torrent

シーディング 1ダウンロード中 0完了 207総ダウンロード数 341

OceanBenchDataset/
- README.md
  2.15 KB
- README.txt
  4.3 KB

ToolACE 複合ツール学習対話データセット

2ヶ月前

CHIMERA一般推論合成データセット

4ヶ月前

CL-bench コンテキスト学習評価ベンチマークデータセット

4ヶ月前

Nemotron-Math-v2 数学推論データセット

5ヶ月前

GroundingME 複雑シーン理解評価データセット

6ヶ月前

TxT360-3efforts マルチタスク推論データセット

6ヶ月前

LongBench-Pro ロングコンテキスト包括的評価データセット

6ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

AIでAIを構築

HyperAI Newsletters

関連データセット

ToolACE 複合ツール学習対話データセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

ToolACE 複合ツール学習対話データセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

ToolACE 複合ツール学習対話データセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

関連データセット

ToolACE 複合ツール学習対話データセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

Command Palette

OceanBench 海洋ベンチマーク評価データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

OceanBench 海洋ベンチマーク評価データセット

関連データセット

ToolACE 複合ツール学習対話データセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

OceanBench 海洋ベンチマーク評価データセット

関連データセット

ToolACE 複合ツール学習対話データセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

ToolACE 複合ツール学習対話データセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

関連データセット

ToolACE 複合ツール学習対話データセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット