Google Lance MedGemma, Basé Sur Gemma 3, Spécialisé Dans La Compréhension De Textes Et D'images Médicaux

Au cours des deux derniers jours, Google I/O 2025 a été très populaire. Dans son discours d'ouverture du premier jour de l'événement, le PDG de la société, Sundar Pichai, a partagé de nombreuses innovations, telles que la gamme complète de mises à niveau de Gemini 2.5, le lancement du mode Agent sur Chrome, la version bêta publique de l'agent de codage Jules, la version officielle d'Android XR, etc. Parmi les mises à jour éblouissantes,Il y a également une réalisation open source majeure dans le domaine médical cachée à l'intérieur : MedGemma.
Selon l'introduction officielle,La série de modèles MedGemma est basée sur Gemma 3.Contient le modèle open source le plus puissant de Google pour la compréhension de textes et d'images médicales, disponible en 2 versions.Il y a quatre milliards de paramètres pour la version multimodale et 27 milliards de paramètres pour la version en texte brut.
Parmi eux, la version multimodale de MedGemma 4B utilise l'encodeur d'images SigLIP, qui est spécialement pré-entraîné et utilise des données couvrant des images médicales anonymisées, notamment des radiographies thoraciques, des images dermatologiques, des images ophtalmologiques et des sections de pathologie tissulaire. Son grand composant de modèle de langage est formé sur une variété de données médicales, notamment des images radiologiques, des patchs d'images histopathologiques, des images ophtalmologiques et dermatologiques et des textes médicaux.et MedGemma 27B a été formé spécifiquement sur des textes médicaux et optimisé pour les calculs en phase d'inférence.
Pour la compréhension de textes médicaux et les scénarios de raisonnement clinique, MedGemma peut effectuer plusieurs tâches telles que la consultation des patients, le triage, l'aide à la décision clinique et le résumé de textes médicaux. Afin d'aider les lecteurs à découvrir les puissantes capacités de MedGemma de manière plus intuitive,La section « Tutoriel » du site officiel d'HyperAI a désormais lancé « Déploiement en un clic du modèle de raisonnement médical MedGemma-27b-text-it ».Venez découvrir la consultation médicale AI !
* Adresse du tutoriel :https://go.hyper.ai/Urygb
Nous avons également préparé des avantages surprises pour les nouveaux utilisateurs enregistrés. Utilisez le code d'invitation « MedGemma » pour vous inscrire sur la plateforme OpenBayes.Vous pouvez obtenir 4 heures d'utilisation gratuite du RTX A6000 (la ressource est valable 1 mois).Quantité limitée, premier arrivé, premier servi !
aussi,La section tutoriel du site officiel a également lancé « vLLM+Open WebUI Deployment II-Medical-8B Medical Reasoning Model ».Le modèle est basé sur Qwen3-8B et les performances du modèle sont optimisées en utilisant un réglage fin supervisé à l'aide d'un ensemble de données d'inférence spécifique au domaine médical et en formant DAPO (une méthode d'optimisation possible) sur un ensemble de données d'inférence dure.
* Adresse du tutoriel :https://go.hyper.ai/8fFFY
Essai de démonstration
1. Après avoir accédé à la page d'accueil de hyper.ai, sélectionnez la page « Tutoriel », sélectionnez « Déploiement en un clic du modèle de raisonnement médical MedGemma-27b-text-it » et cliquez sur « Exécuter ce tutoriel en ligne ».


2. Une fois la page affichée, cliquez sur « Cloner » dans le coin supérieur droit pour cloner le didacticiel dans votre propre conteneur.

3. Sélectionnez « NVIDIA A6000 48 Go » et l'image « vLLM ». La plateforme OpenBayes propose quatre méthodes de facturation. Vous pouvez choisir « Payer au fur et à mesure » ou « Quotidien/Hebdomadaire/Mensuel » selon vos besoins. Cliquez sur « Continuer ». Les nouveaux utilisateurs peuvent s'inscrire en utilisant le lien d'invitation ci-dessous pour obtenir 4 heures de RTX 4090 + 5 heures de temps CPU gratuit !
Lien d'invitation exclusif HyperAI (copier et ouvrir dans le navigateur) :
https://openbayes.com/console/signup?r=Ada0322_NR0n


4. Attendez que les ressources soient allouées. Le premier processus de clonage prend environ 2 minutes. Lorsque le statut passe à « En cours d'exécution », cliquez sur la flèche de saut à côté de « Adresse API » pour accéder à la page de démonstration. Étant donné que le modèle est volumineux, il faut environ 3 minutes pour afficher l'interface WebUI, sinon « Bad Gateway » s'affichera. Veuillez noter que les utilisateurs doivent effectuer l'authentification par nom réel avant d'utiliser la fonction d'accès à l'adresse API.

Démonstration d'effet
Les symptômes décrits par l'auteur sont : « Je me sens un peu étourdi, j'ai envie de vomir et j'ai mal à la gorge. Que dois-je faire ? » On peut constater que MedGemma fournit non seulement différentes solutions de « traitement médical immédiat » et de « soins personnels », mais fournit également les causes possibles de cette série de symptômes.

