KI-Agent übertrifft Ärzte bei Diagnose und Therapie
Ein internationales Forscherteam hat MIRA vorgestellt, einen autonomen medizinischen KI-Agenten, der komplexe Notaufnahme-Workflows innerhalb einer virtualisierten elektronischen Patientenakte bewältigt. Die Studie basiert auf der Analyse von 574 retrospektiven Patientenfällen aus der MIMIC-IV-Datenbank, die Erkrankungen der Chirurgie, Inneren Medizin und Onkologie abdecken. Im Gegensatz zu bisherigen, eng begrenzten Sprachmodell-Anwendungen in der Gesundheitsversorgung agiert MIRA als durchgängiger klinischer Copilot, der Schritt für Schritt Diagnosen stellt, Tests anordnet, Therapien plant und Aufnahmen einleitet. Die Architektur des Agents ist vollständig an den internationalen Standard Fast Healthcare Interoperability Resources angepasst sowie an sechs medizinische Kodierungssysteme wie ICD und SNOMED-CT. MIRA nutzt elf spezialisierte Werkzeuge mit über 85.000 Entscheidungsoptionen, um Labor-, Mikrobiologie- und Bildgebungsuntersuchungen zu bestellen und zu interpretieren. Zur Simulation patientenseitiger Interaktionen kam ein auf der dokumentierten Anamnese basierender Patient-Agent zum Einsatz, der sich durch eine Stabilität von über 99 Prozent auszeichnet und keinerlei vorzeitige Diagnoseinformationen preisgab. In den direkten Vergleichen mit zwei ärztlichen Kohorten erreichte MIRA eine durchschnittliche diagnostische Genauigkeit von 88,9 Prozent. Damit lag die KI sowohl in der Gesamtbewertung als auch in Einzelfällen auf dem Niveau oder leicht über dem menschlichen Leistungsvermögen. Besonders hervorzuheben ist die strenge Einhaltung klinischer Leitlinien: Bei der Verschreibung von Medikamenten und der Auswahl chirurgischer Eingriffe traf MIRA häufiger evidenzbasierte Entscheidungen als die ärztlichen Vergleichsgruppen, ohne dabei zu einer systematischen Überdiagnostik zu führen. Der Agent bestellte zwar häufiger einzelne Blutparameter, kompensierte dies jedoch durch zurückhaltende Bildgebung, sodass die Gesamtnutzung unter dem historischen Praxisniveau blieb. Die Sicherheits- und Robustheitsprüfungen unterstrichen die klinische Tauglichkeit des Systems. Bei der Evaluierung von 468 Verschreibungen wies die KI in 99,8 Prozent aller Fälle korrekte Dosierungs- und Verabreichungsanweisungen auf. Kritische Arzneimittelwechselwirkungen oder unsafe Opioid-Schwellenwerte traten nicht auf. Zudem traf MIRA bei der Entscheidung über eine stationäre Aufnahme von Pneumoniefällen mit einer Recall-Rate von 1,00 Prozent nahezu fehlerfrei. Selbst unter synthetischen Verzerrungsszenarien zeigte der Agent eine stabile Leistung ohne signifikante Genauigkeitseinbußen. Die Autoren betonen, dass MIRA nicht als Ersatz, sondern als kollaboratives Werkzeug konzipiert ist, das dokumentationsintensive Prozesse entlastet. Während die virtuelle Testumgebung gewisse Generalisierungsgrenzen aufzeigen, etabliert die Studie einen maßstabsgebenden Benchmark für autonome Gesundheits-KI. Zukünftige Entwicklungen sollen ökonomische Ressourcensteuerung integrieren und in prospektiven klinischen Studien validiert werden, um den Schritt in die reale Versorgungspraxis zu ermöglichen.
