日付

2年前

サイズ

1.28 GB

データセット構成

論文URL

arxiv.org

タグ

サイエンスのためのAI

このデータセットは 2024 年に Google Research とホプキンス大学の研究チームによって開始され、関連する論文結果は「SPIQA: 科学論文に対するマルチモーダルな質問応答のためのデータセット”。

研究の背景

長い科学研究論文の中で疑問に対する答えを見つけることは、読者が疑問をすぐに解決するのに役立つ重要な研究分野です。ただし、既存の科学論文ベースの質問応答 (QA) データセットはサイズが限られており、テキストコンテンツのみに焦点を当てています。この限界に対処するために、研究チームは SPIQA (Scientific Paper Image Questioning) を立ち上げました。

データセットの概要

これは、コンピューターサイエンスのさまざまな分野の科学研究論文に含まれる複雑な図や表を解釈するために特別に設計された初の大規模な QA データセットです。マルチモーダル大規模言語モデル (MLLM) の専門知識とグラフを理解する能力を活用します。研究チームは、自動および手動のキュレーションを使用してデータセットを作成し、さまざまなチャート、表、概略図、および結果の視覚化をカバーする複数の画像を含む情報検索タスクを設計しました。 SPIQA には、トレーニング、検証、および 3 つの異なる評価パートに分かれた 270,000 の質問が含まれています。 12 のよく知られた基本モデルでの広範な実験を通じて、チームは、研究論文の微妙な側面を理解する現在のマルチモーダルシステムの能力を評価しました。

引用

@article{pramanick2024spiqa, タイトル={SPIQA: 科学論文におけるマルチモーダル質問応答のためのデータセット}、 author={プラマニック、シュラマンとチェラッパ、ラーマとヴェヌゴパラン、スバシニ}、ジャーナル={NeurIPS}、年={2024} }

SPIQA.torrent

シーディング 1ダウンロード中 0完了 248総ダウンロード数 297

SPIQA/
- README.md
  1.95 KB
- README.txt
  3.89 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

2年前

サイズ

1.28 GB

データセット構成

論文URL

arxiv.org

タグ

サイエンスのためのAI

研究の背景

データセットの概要

引用

SPIQA.torrent

シーディング 1ダウンロード中 0完了 248総ダウンロード数 297

SPIQA/
- README.md
  1.95 KB
- README.txt
  3.89 KB

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

SPIQA マルチモーダル科学論文の質問と回答のデータセット

研究の背景

データセットの概要

引用

AIでAIを構築

HyperAI Newsletters

Command Palette

SPIQA マルチモーダル科学論文の質問と回答のデータセット

研究の背景

データセットの概要

引用

関連データセット

逐語的スパンクエリ条件証拠抽出データセット

FigureBench科学イラスト生成ベンチマークデータセット

ChartNetチャートの理解：マルチモーダルデータセット

TACKターゲットキメラ知識ベースデータセット

DeepCrackインフラストラクチャ亀裂検出データセット

SMOL多言語翻訳並列データセット

LongBlocks 長文コンテキスト多言語質問応答データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

長距離山火事・煙検知データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

ParseBench文書解析能力評価データセット

MIA多段階推論および決定軌跡データセット

BRIGHT災害建物評価データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

MDPBench 多言語文書解析ベンチマークデータセット

CHOCLO ラテンアメリカ文化ベンチマークデータセット

DRACOクロスドメイン深層研究ベンチマークデータセット

ToolACE 複合ツール学習対話データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

SPIQA マルチモーダル科学論文の質問と回答のデータセット

研究の背景

データセットの概要

引用

関連データセット

逐語的スパンクエリ条件証拠抽出データセット

FigureBench科学イラスト生成ベンチマークデータセット

ChartNetチャートの理解：マルチモーダルデータセット

TACKターゲットキメラ知識ベースデータセット

DeepCrackインフラストラクチャ亀裂検出データセット

SMOL多言語翻訳並列データセット

LongBlocks 長文コンテキスト多言語質問応答データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

長距離山火事・煙検知データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

ParseBench文書解析能力評価データセット

MIA多段階推論および決定軌跡データセット

BRIGHT災害建物評価データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

MDPBench 多言語文書解析ベンチマークデータセット

CHOCLO ラテンアメリカ文化ベンチマークデータセット

DRACOクロスドメイン深層研究ベンチマークデータセット

ToolACE 複合ツール学習対話データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

逐語的スパンクエリ条件証拠抽出データセット

FigureBench科学イラスト生成ベンチマークデータセット

ChartNetチャートの理解：マルチモーダルデータセット

TACKターゲットキメラ知識ベースデータセット

DeepCrackインフラストラクチャ亀裂検出データセット

SMOL多言語翻訳並列データセット

LongBlocks 長文コンテキスト多言語質問応答データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

長距離山火事・煙検知データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

ParseBench文書解析能力評価データセット

MIA多段階推論および決定軌跡データセット

BRIGHT災害建物評価データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット