HyperAIHyperAI

Command Palette

Search for a command to run...

PubMedVision 大規模医療 VQA データセット

日付

1年前

サイズ

53.54 GB

データセット構成

香港中文大学深セン校

公開URL

github.com

Paper URL

arxiv.org

PubMedVision は、深センビッグデータ研究所、香港中文大学、国家健康データ研究所の研究チームによって 2024 年に作成された大規模かつ高品質の医療マルチモーダル データセットであり、130 万の医療 VQA が含まれていますサンプル。関連する論文結果は「HuatuoGPT-Vision、マルチモーダル LLM への大規模な医療視覚知識の導入に向けて”。

このデータセットは、高度なデータ処理手法を使用して、PubMed 国際医学ジャーナルの記事から医療関連の画像と有益な画像の説明をフィルタリングして、多数の医療に無関係な画像や文脈的に無関係なコンテンツを効果的に除外します。グラフィックデータとテキストデータの整合性を改善するために、研究チームは大規模なビジュアルモデル(GPT-4V)を使用して画像を再記述し、10のシーンのダイアログを構築しました。グラフィックデータとテキストデータは質問に書き直されました。回答フォームを使用して、医療の視覚的知識を強化しました。

PubMedVision.torrent
シーディング 1ダウンロード中 0完了 242総ダウンロード数 742
  • PubMedVision/
    • README.md
      1.46 KB
    • README.txt
      2.93 KB
      • data/
        • PubMedVision.zip
          53.54 GB

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています