HyperAIHyperAI

Command Palette

Search for a command to run...

vor 2 Monaten

MedReseacher-R1: Experte auf medizinischem Gebiet mit tiefgehender Forschung durch einen wissensbasierten Rahmen zur Trajektoriensynthese

MedReseacher-R1: Experte auf medizinischem Gebiet mit tiefgehender Forschung durch einen wissensbasierten Rahmen zur Trajektoriensynthese

Abstract

Neuere Entwicklungen bei großen Sprachmodellen (Large Language Models, LLM) basierten Agenten haben beeindruckende Fähigkeiten in mehreren Domänen gezeigt, wie beispielsweise tiefgreifende Forschungssysteme, die eine überlegene Leistung bei komplexen Informationsbeschaffungs- und Syntheseraufgaben demonstrieren. Obwohl allgemein einsetzbare tiefgreifende Forschungsagenten beeindruckende Fähigkeiten zeigen, stoßen sie erheblich an ihre Grenzen bei medizinischen Anwendungen, wie die begrenzte Genauigkeit führender proprietärer Systeme auf anspruchsvollen medizinischen Benchmark-Tests belegt. Die zentralen Einschränkungen liegen in (1) einem Mangel an ausreichend dichtem medizinischem Wissen für klinische Schlussfolgerungen und (2) einer Beschränkung des Architekturrahmens durch das Fehlen spezialisierter Retrieval-Tools, die auf medizinische Kontexte abgestimmt sind.Wir stellen einen medizinischen tiefgreifenden Forschungsagenten vor, der diese Herausforderungen durch zwei zentrale Innovationen adressiert. Erstens entwickeln wir einen neuartigen Daten-Syntheserahmen mittels medizinischer Wissensgraphen, bei dem die längsten Ketten aus Teilgraphen um seltene medizinische Entitäten extrahiert werden, um komplexe Multi-Hop-Frage-Antwort-Paare zu generieren. Zweitens integrieren wir eine maßgeschneiderte, private medizinische Retrieval-Engine neben allgemein verwendbaren Werkzeugen, was eine präzise Synthese medizinischer Informationen ermöglicht. Unser Ansatz generiert über 2100 unterschiedliche Forschungstrajektorien über 12 medizinische Fachgebiete hinweg, wobei durchschnittlich 4,2 Werkzeuginteraktionen pro Trajektorie stattfinden.Durch ein zweistufiges Trainingsparadigma, das überwachtes Feintuning mit online-Verstärkungslernen unter Verwendung zusammengesetzter Belohnungen kombiniert, zeigt unser Modell MedResearcher-R1-32B außergewöhnliche Leistungsfähigkeit. Es erreicht neue SOTA-Ergebnisse (State-of-the-Art) auf medizinischen Benchmarks und bleibt gleichzeitig wettbewerbsfähig bei allgemeinen tiefgreifenden Forschungsaufgaben. Unsere Arbeit zeigt, dass strategische, domänenspezifische Innovationen in Architektur, Werkzeuggestaltung und der Konstruktion von Trainingsdaten es kleineren, offenen Quellcode-Modellen ermöglichen können, in spezialisierten Bereichen deutlich größere proprietäre Systeme zu übertrumpfen.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp