一键部署 MedGemma-4b-it 多模态医疗 AI 模型
一、教程简介

MedGemma-4b-it 是 Google 于 2025 年 5 月 21 日开发的专为医疗领域设计的多模态医疗 AI 模型,属于 MedGemma 套件中的指令微调版本(Instruction-Tuned),专为医疗图像与文本的联合分析设计。采用了 SigLIP 图像编码器,该编码器经过专门预训练,使用的数据涵盖去标识化的医学图像,包括胸部 X 光、皮肤病图像、眼科图像和组织病理切片。其大语言模型组件则基于多种医学数据进行训练,涵盖放射影像、组织病理图像块、眼科与皮肤科图像以及医学文本。
本教程采用资源为单卡 RTX 4090 。
二、项目示例

三、运行步骤
1. 启动容器后点击 API 地址即可进入 Web 界面
若不显示「模型」,这表示模型正在初始化,由于模型较大,请等待约 3-4 分钟后刷新页面。
2. 进入网页后,即可与模型展开对话
使用步骤

四、交流探讨
🖌️ 如果大家看到优质项目,欢迎后台留言推荐!另外,我们还建立了教程交流群,欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓

引用信息
本项目引用信息如下:
@misc{medgemma-hf,
author = {Google},
title = {MedGemma Hugging Face}
howpublished = {\url{https://huggingface.co/collections/google/medgemma-release-680aade845f90bec6a3f60c4}},
year = {2025},
note = {Accessed: [Insert Date Accessed, e.g., 2025-05-20]}
}