日付

2年前

サイズ

428.1 MB

データセット構成

タグ

このデータセットは、上海交通大学がリリースしたマルチモーダルベンチマークテスト MULTI で、複雑な表や画像を理解し、長いテキスト推論を実行するマルチモーダル大規模モデルの能力を評価するように設計されています。このテストでは、さまざまな入力が行われ、実際の試験スタイルを反映した正確な回答または自由回答が求められます。 MULTI には、数式の導出から画像分析、クロスモーダル推論まで、さまざまな範囲のタスクをカバーする 18,000 を超える質問が含まれています。研究チームはまた、500 問からなる厳選されたパズルのサブセットである MULTI-Elite と、4,500 を超える外部知識コンテキストを含むデータセットである MULTI-Extend も作成しました。 MULTI は、堅牢な評価プラットフォームとして機能するだけでなく、エキスパート AI の開発への道筋も示します。

引用

@article{zhu2025multi, title={{MULTI}: テキストと画像を使用したマルチモーダルなリーダーボードの理解}, author={Zichen Zhu、Yang Xu、Lu Chen、Jingkai Yang、Yichuan Ma、Yiming Sun、Hailin Wen、Jiaqi Liu、Jinyu Cai、Yingzi Ma、Situo Zhang、Zihan Zhao、Liangtai Sun、Kai Yu}、ジャーナル＝「SCIENCE CHINA 情報科学」年 = “2025年”、ボリューム = “68”、数値 = “10”、ページ = “200107.1–200107.26”, doi = “https://doi.org/10.1007/s11432-024-4602-x” }

MULTI-Benchmark.torrent

シーディング 2ダウンロード中 0完了 291総ダウンロード数 328

MULTI-Benchmark/
- README.md
  1.49 KB
- README.txt
  2.98 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

映画の感情データセット

Command Palette

MULTI-Benchmark: テキストと画像を使用したマルチモーダル理解度ランキング

引用

AIでAIを構築

HyperAI Newsletters

Command Palette

MULTI-Benchmark: テキストと画像を使用したマルチモーダル理解度ランキング

引用

関連データセット

MAKIEVAL 多言語文化知識評価データセット

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

FigureBench科学イラスト生成ベンチマークデータセット

映画の感情データセット

ノイズの多い医療文書画像データセット

OpenSAL360パノラマビデオ顕著性データセット

EAVSD（電子商取引広告ビデオストーリーボードデータセット）

DeepCrackインフラストラクチャ亀裂検出データセット

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

イネ葉病害データセット

MemLensマルチモーダル長コンテキストベンチマークデータセット

世界の地震データ（マグニチュード4.5以上）：世界中で発生したマグニチュード4.5以上の地震のデータセット。

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

乳がん：マルチモーダル融合データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

Transfermarkt サッカー データセット

BRIGHT災害建物評価データセット

ワールドモデルベンチデータセット

AIでAIを構築

HyperAI Newsletters

Command Palette

MULTI-Benchmark: テキストと画像を使用したマルチモーダル理解度ランキング

引用

関連データセット

MAKIEVAL 多言語文化知識評価データセット

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

FigureBench科学イラスト生成ベンチマークデータセット

映画の感情データセット

ノイズの多い医療文書画像データセット

OpenSAL360パノラマビデオ顕著性データセット

EAVSD（電子商取引広告ビデオストーリーボードデータセット）

DeepCrackインフラストラクチャ亀裂検出データセット

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

イネ葉病害データセット

MemLensマルチモーダル長コンテキストベンチマークデータセット

世界の地震データ（マグニチュード4.5以上）：世界中で発生したマグニチュード4.5以上の地震のデータセット。

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

乳がん：マルチモーダル融合データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

Transfermarkt サッカー データセット

BRIGHT災害建物評価データセット

ワールドモデルベンチデータセット

AIでAIを構築

HyperAI Newsletters

関連データセット

MAKIEVAL 多言語文化知識評価データセット

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

FigureBench科学イラスト生成ベンチマークデータセット

映画の感情データセット

ノイズの多い医療文書画像データセット

OpenSAL360パノラマビデオ顕著性データセット

EAVSD（電子商取引広告ビデオストーリーボードデータセット）

DeepCrackインフラストラクチャ亀裂検出データセット

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

イネ葉病害データセット

MemLensマルチモーダル長コンテキストベンチマークデータセット

世界の地震データ（マグニチュード4.5以上）：世界中で発生したマグニチュード4.5以上の地震のデータセット。

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

乳がん：マルチモーダル融合データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

Transfermarkt サッカー データセット

BRIGHT災害建物評価データセット

ワールドモデルベンチデータセット

関連データセット

MAKIEVAL 多言語文化知識評価データセット

Transfermarkt サッカーデータセット

Transfermarkt サッカーデータセット

Transfermarkt サッカーデータセット

Transfermarkt サッカーデータセット