PubMedVision 大規模医療 VQA データセット
※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。
PubMedVision は、深センビッグデータ研究所、香港中文大学、国家健康データ研究所の研究チームによって 2024 年に作成された大規模かつ高品質の医療マルチモーダル データセットであり、130 万の医療 VQA が含まれていますサンプル。関連する論文結果は「HuatuoGPT-Vision、マルチモーダル LLM への大規模な医療視覚知識の導入に向けて”。
このデータセットは、高度なデータ処理手法を使用して、PubMed 国際医学ジャーナルの記事から医療関連の画像と有益な画像の説明をフィルタリングして、多数の医療に無関係な画像や文脈的に無関係なコンテンツを効果的に除外します。グラフィックデータとテキストデータの整合性を改善するために、研究チームは大規模なビジュアルモデル(GPT-4V)を使用して画像を再記述し、10のシーンのダイアログを構築しました。グラフィックデータとテキストデータは質問に書き直されました。回答フォームを使用して、医療の視覚的知識を強化しました。
PubMedVision.torrent
シーディング 1ダウンロード中 0ダウンロード完了 111総ダウンロード数 477