Command Palette
Search for a command to run...
MedReseacher-R1: Experte auf medizinischem Gebiet mit tiefgehender Forschung durch einen wissensbasierten Rahmen zur Trajektoriensynthese

Abstract
Neuere Entwicklungen bei großen Sprachmodellen (Large Language Models, LLM) basierten Agenten haben beeindruckende Fähigkeiten in mehreren Domänen gezeigt, wie beispielsweise tiefgreifende Forschungssysteme, die eine überlegene Leistung bei komplexen Informationsbeschaffungs- und Syntheseraufgaben demonstrieren. Obwohl allgemein einsetzbare tiefgreifende Forschungsagenten beeindruckende Fähigkeiten zeigen, stoßen sie erheblich an ihre Grenzen bei medizinischen Anwendungen, wie die begrenzte Genauigkeit führender proprietärer Systeme auf anspruchsvollen medizinischen Benchmark-Tests belegt. Die zentralen Einschränkungen liegen in (1) einem Mangel an ausreichend dichtem medizinischem Wissen für klinische Schlussfolgerungen und (2) einer Beschränkung des Architekturrahmens durch das Fehlen spezialisierter Retrieval-Tools, die auf medizinische Kontexte abgestimmt sind.Wir stellen einen medizinischen tiefgreifenden Forschungsagenten vor, der diese Herausforderungen durch zwei zentrale Innovationen adressiert. Erstens entwickeln wir einen neuartigen Daten-Syntheserahmen mittels medizinischer Wissensgraphen, bei dem die längsten Ketten aus Teilgraphen um seltene medizinische Entitäten extrahiert werden, um komplexe Multi-Hop-Frage-Antwort-Paare zu generieren. Zweitens integrieren wir eine maßgeschneiderte, private medizinische Retrieval-Engine neben allgemein verwendbaren Werkzeugen, was eine präzise Synthese medizinischer Informationen ermöglicht. Unser Ansatz generiert über 2100 unterschiedliche Forschungstrajektorien über 12 medizinische Fachgebiete hinweg, wobei durchschnittlich 4,2 Werkzeuginteraktionen pro Trajektorie stattfinden.Durch ein zweistufiges Trainingsparadigma, das überwachtes Feintuning mit online-Verstärkungslernen unter Verwendung zusammengesetzter Belohnungen kombiniert, zeigt unser Modell MedResearcher-R1-32B außergewöhnliche Leistungsfähigkeit. Es erreicht neue SOTA-Ergebnisse (State-of-the-Art) auf medizinischen Benchmarks und bleibt gleichzeitig wettbewerbsfähig bei allgemeinen tiefgreifenden Forschungsaufgaben. Unsere Arbeit zeigt, dass strategische, domänenspezifische Innovationen in Architektur, Werkzeuggestaltung und der Konstruktion von Trainingsdaten es kleineren, offenen Quellcode-Modellen ermöglichen können, in spezialisierten Bereichen deutlich größere proprietäre Systeme zu übertrumpfen.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.