Neue Prompting-Strategie steigert KI-Genauigkeit in der Gesundheitsberatung
Forscher der Technischen Universität Berlin haben eine neue Methode entwickelt, um die Genauigkeit von Gesundheitsratschlägen durch Künstliche Intelligenz deutlich zu verbessern. Die Studie, veröffentlicht im Fachjournal JMIR Biomedical Engineering, zeigt, dass Large Language Models (LLMs), also große Sprachmodelle, deutlich bessere Ergebnisse liefern, wenn sie lernen, menschliche Intuition und Denkprozesse zu imitieren. Dies markiert einen wichtigen Paradigmenwechsel in der sogenannten Prompt-Engineering-Strategie, indem weg von rein technischen Anweisungen hin zu Ansätzen geht, die auf angewandter Psychologie basieren. Ein bekanntes Problem bei der Nutzung von KI-Tools wie ChatGPT für medizinische Fragen ist deren extreme Vorsicht. Oftmals empfehlen diese Systeme trotz einfacher Symptome sofortige professionelle Hilfe oder einen Notfallbesuch. Diese sogenannte Überweisung (Over-Triage) führt nicht nur zu unnötigen Gesundheitskosten, sondern verursacht auch unnötige Ängste bei den Patienten. Um dieses Phänomen zu adressieren, testete das Forschungsteam um Marvin Kopka und Markus A. Feufel zehn verschiedene Modelle, darunter die neuesten Versionen GPT-4o und die GPT-5-Serie. Sie verwendeten dabei sogenannte „Naturalistic Decision-Making"-Prompts, kurz NDM. Anders als herkömmliche logische Anweisungen konzentriert sich NDM darauf, wie menschliche Experten unter Unsicherheit und in komplexen Situationen Entscheidungen treffen. Die Forscher setzten dabei zwei spezifische psychologische Rahmenwerke ein, die den Modellen eine Art Denkblueprint für den Umgang mit unklaren oder unvollständigen Daten geben. Das Ergebnis war eine signifikante Steigerung der Genauigkeit, da die KI nun gelernt hat, ihre eigenen anfänglichen Einschätzungen zu hinterfragen und mögliche Ergebnisse realistisch zu simulieren, anstatt automatisch zur radikalsten Option zu greifen. Marvin Kopka, einer der Hauptautoren der Studie, betonte, dass Tests bei KI oft unter unrealistischen Bedingungen mit perfekten Informationen stattfinden. In der realen Welt sind Probleme jedoch häufig unklar definiert. Da es bereits gute Modelle für menschliche Entscheidungsfindung in solchen Szenarien gibt, erschien der Einsatz dieser Prinzipien als natürlicher nächster Schritt. Ziel ist es, KI-Tools zu entwickeln, die in echten Entscheidungssituationen tatsächlich nützlich sind und die Lücke zur personalisierten Medizin schließen helfen. Obwohl diese Erkenntnisse einen erheblichen Fortschritt bei der Integration von KI in klinische Entscheidungsprozesse darstellen, warnt das Team davor, die Ergebnisse vorschnell zu verallgemeinern. Die aktuellen Modelle funktionieren am besten in kontrollierten Umgebungen. Es bleibt zukünftiger Forschung überlassen, zu klären, ob diese psychologisch inspirierten Anweisungen auch im alltäglichen Leben von Nutzern in unstandardisierten Situationen zu besseren Entscheidungen führen. Bislang zeigen die Ergebnisse jedoch, dass die Nachahmung menschlicher Kognition im Vergleich zur reinen Rechenlogik einen großen Vorteil bieten kann, insbesondere wenn medizinische Daten unsicher oder lückenhaft sind.
