Chatbot-Infos zu Alkohol und Brustkrebs widersprechen sich
Eine aktuelle Studie der University of Missouri, die auf der 49. jährlichen wissenschaftlichen Tagung der Research Society on Alcohol in San Antonio vorgestellt wurde, offenbart erhebliche Mängel bei der Informationsqualität von generativer KI im Gesundheitsbereich. Das Forschungsteam um Allison Brandt Anbari analysierte, wie 22 verfügbare Generative-AI-Chatbots auf Fragen zur Verbindung zwischen Alkoholkonsum und Brustkrebsrisiko reagieren. Die Abfrage erfolgte mit drei unterschiedlich formulierten Prompts, die sich an offiziellen Quellen wie der Weltgesundheitsorganisation, den US-Gesundheitsbehörden CDC und der National Breast Cancer Foundation orientierten. Die Auswertung der 66 generierten Antworten zeigt ein klares Muster der Unzuverlässigkeit. Erstens weisen die KI-Ausgaben massive Inkonsistenzen in Inhalt und Darstellungsstil auf. Zahlreiche Modelle relativieren den zwischenzeitlich als gesichert geltenden kausalen Zusammenhang zwischen Alkohol und Brustkrebs, indem sie die Wissenschaftslage als noch unzureichend erforscht darzustellen versuchen. Dies stellt ein potentielles Risiko für die öffentliche Gesundheit dar, zumal das Bewusstsein für diese Wechselwirkung trotz der Einstufung von Alkohol als Karzinom der Gruppe 1 seit 1988 nach wie vor gering ist. Zweitens liegt die Komplexität der Antworten weit über den empfohlenen Standards. Die KI-Texte erfordern ein Leseverständnis auf Collegestufe und sind fachsprachlich stark aufgeladen. Dies steht im direkten Widerspruch zu den Empfehlungen der US-National Institutes of Health, die Gesundheitsinformationen auf ein Niveau von sechs Schuljahren oder darunter begrenzen wollen. Die hohe Hürde bei der Entschlüsselung der KI-Ausgaben schließt einen Großteil der Bevölkerung von einer sachgerechten Risikobewertung aus. Drittens bestätigte die Studie, dass die exakte Formulierung des Prompts den Output maßgeblich steuert. Die Wissenschaftler betonen dabei eine kritische Distinktion: Gesundheitskompetenz, digitale Kompetenz und Prompt-Kompetenz sind nicht gleichzusetzen. Die Art der Eingabe bestimmt letztlich, ob präzise medizinische Fakten oder vage Unsicherheiten generiert werden. Aus public-health-Perspektive wird die Entwicklung als alarmierend bewertet. Die zunehmende Abhängigkeit der Bevölkerung von Chatbots zur Gesundheitsinformationierung erfordert ein Umdenken. Ärztinnen, Ärzte und öffentliche Gesundheitsverantwortliche müssen sich der Variabilität dieser Systeme bewusst sein und in der Lage sein, Nutzer gezielt auf unvollständige oder irreführende KI-Antworten hinzuweisen. Die Studie unterstreicht die Dringlichkeit, KI-Tools im medizinischen Kontext nicht als autonome Wissensquellen, sondern als ergänzende, jedoch streng zu validierende Instrumente zu behandeln.
