HyperAI초신경

MMed-Llama-3-8B의 원클릭 배포

튜토리얼 소개

该教程仅需使用 RTX 4090 即可启动。 

MMed-Llama-3-8B는 상하이 교통대학교와 상하이 인공지능연구소의 연구팀이 2024년에 개발한 다국어 의료 대규모 언어 모델입니다. 매개변수가 8B에 불과한 이 모델은 특히 다국어 의료 응용 분야에서 GPT-4와 같은 대규모 모델과 비슷한 성능을 보여줍니다. 관련 논문 결과는 다음과 같습니다.의학을 위한 다국어 언어 모델 구축을 향해"라는 제목으로 Nature Communications에 게재되었습니다.

모델은 다음을 기반으로 구성됩니다.대규모 다국어 의학 코퍼스 MMedC이 코퍼스에는 영어, 중국어, 일본어, 프랑스어, 러시아어, 스페인어 등 6개 주요 언어로 작성된 약 255억 개의 의료 관련 토큰이 포함되어 있습니다. MMedC 코퍼스는 일반적인 대규모 언어 모델에 대한 자기회귀 도메인 적응 기능을 제공하기 위해 만들어졌습니다.

MMed-Llama-3-8B 모델 MMedBench 벤치마크기존 오픈소스 모델보다 성능이 뛰어나며, 어떤 면에서는 GPT-4와도 비슷합니다. 또한 이 모델은 다국어 의학 질문에 대한 답변 업무에서도 강력한 역량을 보여주며, 이는 영어가 아닌 의학 질문을 처리하는 데 효과적임을 보여줍니다.

이 튜토리얼은 해당 모델에 대한 원클릭 배포 데모 튜토리얼입니다. API 주소를 직접 복제하여 추론에 사용할 수 있습니다.


효과 예시


실행 단계

1. 在该项目右上角点击「克隆」,随后依次点击「下一步」即可完成:基本信息> 选择算力> 审核等步骤。最后点击「继续执行」即可在个人容器内开启本项目。

2. 等待容器资源分配完成后,可直接使用平台提供的 API 地址进行操作页面的访问(需要提前完成实名认证,此步无需打开工作空间)
3. 与模型进行对话

토론 및 교류

🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔 및 [튜토리얼 교환]에 댓글을 남겨 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓