@misc{chen2024huatuogptvisioninjectingmedicalvisual, title={HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale}, author={Junying Chen and Ruyi Ouyang and Anningzhe Gao and Shunian Chen and Guiming Hardy Chen and Xidong Wang and Ruifei Zhang and Zhenyang Cai and Ke Ji and Guangjun Yu and Xiang Wan and Benyou Wang}, year={2024}, eprint={2406.19280}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2406.19280}, }

Date

il y a 8 mois

Taille

2.31 GB

Organisation

URL du document

2406.19280

Licence

Apache 2.0

Balises

Décrivain D'image

Imagerie Médicale

PubMedVision est un ensemble de données d'évaluation des capacités médicales multimodales, publié en 2024 par l'Institut de recherche sur le Big Data de Shenzhen, l'Université chinoise de Hong Kong (Shenzhen) et l'Institut national du Big Data médical (Shenzhen). Les résultats de l'étude sont les suivants :HuatuoGPT-Vision : Vers une intégration à grande échelle des connaissances médicales visuelles dans les LLM multimodaux", qui vise à fournir des ressources de test standardisées pour les modèles de langage multimodaux de grande taille (MLLM) dans les tâches de compréhension de texte et de vision médicale pour tester leurs performances de fusion des connaissances visuelles et de raisonnement dans le domaine médical. Cet ensemble de données contient environ 1,3 million d'exemples de questions-réponses visuelles médicales (QVV), dont 647 031 exemples de QVV alignés et 647 031 exemples de QVV de réglage fin basés sur des instructions. Les données sont constituées de 914 960 images médicales soigneusement sélectionnées et de leur contexte (titres et citations), couvrant diverses modalités d'imagerie médicale et régions anatomiques. Chaque exemple est composé d'une image et d'un texte explicatif tiré d'un article médical. Des modèles multimodaux de langage étendu (tels que GPT-4V) sont utilisés pour générer la description de l'image, la question et la réponse correspondantes.

Citation

@misc{chen2024huatuogptvisioninjectingmedicalvisual,
title={HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale},
author={Junying Chen and Ruyi Ouyang and Anningzhe Gao and Shunian Chen and Guiming Hardy Chen and Xidong Wang and Ruifei Zhang and Zhenyang Cai and Ke Ji and Guangjun Yu and Xiang Wan and Benyou Wang},
year={2024},
eprint={2406.19280},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2406.19280},
}

PubMedVision2510.torrent

Partage 2Téléchargement 0Terminé 21Total des téléchargements 159

PubMedVision2510/
- README.md
  1.94 KB
- README.txt
  3.88 KB

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

il y a 3 heures

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

il y a 18 jours

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

il y a 6 jours

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

il y a 19 jours

Ensemble De Données De Référence Multimodal À Contexte Long MemLens

il y a 19 jours

Ensemble De Données d'inférence Visuelle VisCoR-55K

il y a un mois

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

il y a un mois

Ensemble De Données De Référence En Monde Réel Claw-Eval

il y a un mois

Ensemble De Données Sur La Détection Des Déchets Médicaux

il y a un mois

Cancer Du Sein : Ensemble De Données De Fusion Multimodale

il y a un mois

Ensemble De Données De Compréhension Du Graphe d'étalonnage Quantique QCalEval

il y a 2 mois

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

il y a un jour

Ensemble De Données BRIGHT Pour l'évaluation Des Bâtiments Sinistrés

il y a un jour

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

il y a un jour

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données

Discuter sur Discord

Date

il y a 8 mois

Taille

2.31 GB

Organisation

URL du document

2406.19280

Licence

Apache 2.0

Balises

Décrivain D'image

Imagerie Médicale

Citation

@misc{chen2024huatuogptvisioninjectingmedicalvisual,
title={HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale},
author={Junying Chen and Ruyi Ouyang and Anningzhe Gao and Shunian Chen and Guiming Hardy Chen and Xidong Wang and Ruifei Zhang and Zhenyang Cai and Ke Ji and Guangjun Yu and Xiang Wan and Benyou Wang},
year={2024},
eprint={2406.19280},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2406.19280},
}

PubMedVision2510.torrent

Partage 2Téléchargement 0Terminé 21Total des téléchargements 159

PubMedVision2510/
- README.md
  1.94 KB
- README.txt
  3.88 KB

undefined

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données d'évaluation Multimodale Médicale PubMedVision

Citation

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données d'évaluation Multimodale Médicale PubMedVision

Citation

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données De Reconstruction d'objets 3D Pour Artistes SAM 3D

Ensemble De Données d'images De Documents Médicaux Bruitées

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

Base De Données De Connaissances TACK Targeted Chimera

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Ensemble De Données De Référence Multimodal À Contexte Long MemLens

Ensemble De Données d'inférence Visuelle VisCoR-55K

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données Sur La Détection Des Déchets Médicaux

Cancer Du Sein : Ensemble De Données De Fusion Multimodale

Ensemble De Données De Compréhension Du Graphe d'étalonnage Quantique QCalEval

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données BRIGHT Pour l'évaluation Des Bâtiments Sinistrés

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données d'évaluation Multimodale Médicale PubMedVision

Citation

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données De Reconstruction d'objets 3D Pour Artistes SAM 3D

Ensemble De Données d'images De Documents Médicaux Bruitées

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

Base De Données De Connaissances TACK Targeted Chimera

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Ensemble De Données De Référence Multimodal À Contexte Long MemLens

Ensemble De Données d'inférence Visuelle VisCoR-55K

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données Sur La Détection Des Déchets Médicaux

Cancer Du Sein : Ensemble De Données De Fusion Multimodale

Ensemble De Données De Compréhension Du Graphe d'étalonnage Quantique QCalEval

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données BRIGHT Pour l'évaluation Des Bâtiments Sinistrés

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données De Reconstruction d'objets 3D Pour Artistes SAM 3D

Ensemble De Données d'images De Documents Médicaux Bruitées

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

Base De Données De Connaissances TACK Targeted Chimera

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Ensemble De Données De Référence Multimodal À Contexte Long MemLens

Ensemble De Données d'inférence Visuelle VisCoR-55K

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données Sur La Détection Des Déchets Médicaux

Cancer Du Sein : Ensemble De Données De Fusion Multimodale

Ensemble De Données De Compréhension Du Graphe d'étalonnage Quantique QCalEval

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données BRIGHT Pour l'évaluation Des Bâtiments Sinistrés

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données De Reconstruction d'objets 3D Pour Artistes SAM 3D

Ensemble De Données d'images De Documents Médicaux Bruitées

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

Base De Données De Connaissances TACK Targeted Chimera

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench