HyperAIHyperAI

Command Palette

Search for a command to run...

HealthGPT: KI-gestützter Medizinischer Assistent

Date

vor 7 Monaten

Size

600.63 MB

License

Apache 2.0

Paper URL

2502.09838

1. Einführung in das Tutorial

GitHub Stars

HealthGPT, ein umfangreiches medizinisches visuelles Sprachmodell (Med-LVLM), das am 16. März 2025 von der Zhejiang-Universität, der Universität für Elektronische Wissenschaft und Technologie Chinas, Alibaba, der Hong Kong University of Science and Technology und der National University of Singapore gemeinsam veröffentlicht wurde, bietet durch heterogene Wissensadaption ein einheitliches Framework für Aufgaben des medizinischen visuellen Verständnisses und der Bildgenerierung. Es verwendet eine innovative heterogene Low-Rank-Adaption (H-LoRA)-Technik, die Wissen für visuelles Verständnis und Bildgenerierung in unabhängigen Plugins speichert, um Konflikte zwischen den Aufgaben zu vermeiden. HealthGPT bietet zwei Versionen: HealthGPT-M3 (3,8 Milliarden Parameter) und HealthGPT-L14 (14 Milliarden Parameter), basierend auf den vortrainierten Sprachmodellen Phi-3-mini bzw. Phi-4. Das Modell führt hierarchische visuelle Wahrnehmung (HVP) und eine dreistufige Lernstrategie (TLS) ein, um das Lernen visueller Merkmale und die Anpassungsfähigkeit an die jeweilige Aufgabe zu optimieren. Zugehörige Forschungsarbeiten sind verfügbar. HealthGPT: Ein medizinisches umfassendes Vision-Language-Modell zur Vereinheitlichung von Verständnis und Generierung durch heterogene Wissensanpassung Es wurde in die ICML 2025 aufgenommen und als Spotlight ausgewählt.

Dieses Tutorial verwendet Ressourcen für eine einzelne RTX A6000-Karte. Englisch wird empfohlen.

Das Projekt bietet zwei Modellvarianten:

  • HealthGPT-M3: Eine kleinere Version, optimiert für Geschwindigkeit und reduzierten Speicherverbrauch.
  • HealthGPT-L14: Eine größere Version, die für höhere Leistung und komplexere Aufgaben entwickelt wurde.

2. Projektbeispiele

3. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Anwendungsschritte

Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 2–3 Minuten und aktualisieren Sie die Seite.

4. Diskussion

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓

Zitationsinformationen

Dank an den Github-Benutzer xxxjjjyyy1  Bereitstellung dieses Tutorials. Die Zitationsinformationen für dieses Projekt lauten wie folgt:

@misc{lin2025healthgptmedicallargevisionlanguage,
      title={HealthGPT: A Medical Large Vision-Language Model for Unifying Comprehension and Generation via Heterogeneous Knowledge Adaptation}, 
      author={Tianwei Lin and Wenqiao Zhang and Sijing Li and Yuqian Yuan and Binhe Yu and Haoyuan Li and Wanggui He and Hao Jiang and Mengze Li and Xiaohui Song and Siliang Tang and Jun Xiao and Hui Lin and Yueting Zhuang and Beng Chin Ooi},
      year={2025},
      eprint={2502.09838},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2502.09838}, 
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp