该教程仅需使用 RTX 4090 即可启动。
MMed-Llama-3-8B 是由上海交通大学和上海人工智能实验室的研究团队于 2024 年开发的一款多语言医学大型语言模型。该模型在仅有 8B 参数的情况下,展现出了与 GPT-4 等大规模模型相媲美的性能,特别是在多语言医学领域的应用上表现出色。相关论文成果为「Towards building multilingual language model for medicine」,并已发表于《nature communications》。
该模型的构建基于大规模多语言医学语料库 MMedC,该语料库包含约 255 亿个与医学相关的 token,涵盖英语、中文、日语、法语、俄语和西班牙语等六种主要语言。 MMedC 语料库的构建,旨在为通用大型语言模型提供自回归领域的适应能力。
MMed-Llama-3-8B 模型在 MMedBench 基准测试上的表现超越了现有的开源模型,甚至在某些方面与 GPT-4 相媲美。此外,该模型还显示出在多语言医疗问答任务中的强大能力,这表明了其在处理非英语医学问题时的有效性。
该教程为模型的一键部署 Demo 教程,直接克隆后打开 API 地址即可推理使用。
1. 在该项目右上角点击「克隆」,随后依次点击「下一步」即可完成:基本信息> 选择算力> 审核等步骤。最后点击「继续执行」即可在个人容器内开启本项目。
2. 等待容器资源分配完成后,可直接使用平台提供的 API 地址进行操作页面的访问(需要提前完成实名认证,此步无需打开工作空间)
3. 与模型进行对话
🖌️ 如果大家看到优质项目,欢迎后台留言推荐!另外,我们还建立了教程交流群,欢迎小伙伴们扫码备注【教程交流】入群探讨各类技术问题、分享应用效果↓