@misc{chen2024huatuogptvisioninjectingmedicalvisual, title={HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale}, author={Junying Chen and Ruyi Ouyang and Anningzhe Gao and Shunian Chen and Guiming Hardy Chen and Xidong Wang and Ruifei Zhang and Zhenyang Cai and Ke Ji and Guangjun Yu and Xiang Wan and Benyou Wang}, year={2024}, eprint={2406.19280}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2406.19280}, }

日付

8ヶ月前

サイズ

2.31 GB

データセット構成

論文URL

2406.19280

ライセンス

Apache 2.0

タグ

画像説明

医療画像

PubMedVisionは、深圳ビッグデータ研究所、香港中文大学（深圳）、国立医療ビッグデータ研究所（深圳）が2024年に公開した医療マルチモーダル能力評価のためのデータセットです。関連論文の結果は「HuatuoGPT-Vision、マルチモーダル LLM への大規模な医療視覚知識の導入に向けて」は、医療分野における視覚知識の融合と推論パフォーマンスをテストするために、医療ビジョンテキスト理解タスクにおけるマルチモーダル大規模言語モデル（MLLM）の標準化されたテストリソースを提供することを目的としています。このデータセットには、約130万件の医療用ビジュアル質問応答（VQA）サンプルが含まれており、これには647,031件のアラインメント済みVQAサンプルと、さらに647,031件の指示ベースの微調整VQAサンプルが含まれます。このデータは、厳選された914,960枚の医療画像と、それらに付随するコンテキスト（タイトルや本文中の引用など）から構成されており、様々な医療画像モダリティと解剖学的領域を網羅しています。各サンプルは、医学論文からの画像と説明文で構成されています。対応する画像の説明、質問、回答を生成するために、マルチモーダル大規模言語モデル（GPT-4Vなど）が使用されています。

引用

@misc{chen2024huatuogptvisioninjectingmedicalvisual,
title={HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale},
author={Junying Chen and Ruyi Ouyang and Anningzhe Gao and Shunian Chen and Guiming Hardy Chen and Xidong Wang and Ruifei Zhang and Zhenyang Cai and Ke Ji and Guangjun Yu and Xiang Wan and Benyou Wang},
year={2024},
eprint={2406.19280},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2406.19280},
}

PubMedVision2510.torrent

シーディング 2ダウンロード中 0完了 21総ダウンロード数 159

PubMedVision2510/
- README.md
  1.94 KB
- README.txt
  3.88 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

8ヶ月前

サイズ

2.31 GB

データセット構成

論文URL

2406.19280

ライセンス

Apache 2.0

タグ

画像説明

医療画像

引用

@misc{chen2024huatuogptvisioninjectingmedicalvisual,
title={HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale},
author={Junying Chen and Ruyi Ouyang and Anningzhe Gao and Shunian Chen and Guiming Hardy Chen and Xidong Wang and Ruifei Zhang and Zhenyang Cai and Ke Ji and Guangjun Yu and Xiang Wan and Benyou Wang},
year={2024},
eprint={2406.19280},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2406.19280},
}

PubMedVision2510.torrent

シーディング 2ダウンロード中 0完了 21総ダウンロード数 159

PubMedVision2510/
- README.md
  1.94 KB
- README.txt
  3.88 KB

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

PubMedVision医療マルチモーダル評価データセット

引用

AIでAIを構築

HyperAI Newsletters

Command Palette

PubMedVision医療マルチモーダル評価データセット

引用

関連データセット

MAKIEVAL 多言語文化知識評価データセット

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

ノイズの多い医療文書画像データセット

ChartNetチャートの理解：マルチモーダルデータセット

TACKターゲットキメラ知識ベースデータセット

EAVSD（電子商取引広告ビデオストーリーボードデータセット）

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

ViMUビデオメタファー理解データセット

MemLensマルチモーダル長コンテキストベンチマークデータセット

VisCoR-55K ビジュアル推論データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

医療廃棄物検出データセット

乳がん：マルチモーダル融合データセット

QCalEval 量子較正グラフの理解データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

BRIGHT災害建物評価データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

PubMedVision医療マルチモーダル評価データセット

引用

関連データセット

MAKIEVAL 多言語文化知識評価データセット

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

ノイズの多い医療文書画像データセット

ChartNetチャートの理解：マルチモーダルデータセット

TACKターゲットキメラ知識ベースデータセット

EAVSD（電子商取引広告ビデオストーリーボードデータセット）

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

ViMUビデオメタファー理解データセット

MemLensマルチモーダル長コンテキストベンチマークデータセット

VisCoR-55K ビジュアル推論データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

医療廃棄物検出データセット

乳がん：マルチモーダル融合データセット

QCalEval 量子較正グラフの理解データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

BRIGHT災害建物評価データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

MAKIEVAL 多言語文化知識評価データセット

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

ノイズの多い医療文書画像データセット

ChartNetチャートの理解：マルチモーダルデータセット

TACKターゲットキメラ知識ベースデータセット

EAVSD（電子商取引広告ビデオストーリーボードデータセット）

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

ViMUビデオメタファー理解データセット

MemLensマルチモーダル長コンテキストベンチマークデータセット

VisCoR-55K ビジュアル推論データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

医療廃棄物検出データセット

乳がん：マルチモーダル融合データセット

QCalEval 量子較正グラフの理解データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

BRIGHT災害建物評価データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

関連データセット

MAKIEVAL 多言語文化知識評価データセット

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

ノイズの多い医療文書画像データセット

ChartNetチャートの理解：マルチモーダルデータセット

TACKターゲットキメラ知識ベースデータセット

EAVSD（電子商取引広告ビデオストーリーボードデータセット）

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット