Command Palette
Search for a command to run...
Medizinisches Graphen-RAG: Ein Schritt hin zu sicheren medizinischen Großsprachmodellen durch graphbasierte abfrageverstärkte Generierung
Medizinisches Graphen-RAG: Ein Schritt hin zu sicheren medizinischen Großsprachmodellen durch graphbasierte abfrageverstärkte Generierung
Junde Wu Jiayuan Zhu Yunli Qi Jingkun Chen Min Xu et al
Zusammenfassung
Wir stellen einen neuartigen, graphenbasierten Retrieval-Augmented Generation (RAG)-Ansatz für den medizinischen Bereich vor, der als \textbf{MedGraphRAG} bezeichnet wird und darauf abzielt, die Fähigkeiten von Large Language Models (LLM) zur Generierung evidenzbasierter medizinischer Antworten zu verbessern, wodurch die Sicherheit und Zuverlässigkeit bei der Behandlung sensibler medizinischer Daten erhöht werden. Graphenbasierte RAG-Verfahren (GraphRAG) nutzen LLMs, um RAG-Daten in graphenartige Strukturen zu organisieren und zeigen großes Potenzial, um umfassende Einblicke aus langen Dokumenten zu gewinnen. Ihre herkömmliche Implementierung ist jedoch für den allgemeinen Einsatz zu komplex und verfügt über keine Fähigkeit zur Generierung evidenzbasierter Antworten, was ihre Wirksamkeit im medizinischen Bereich einschränkt. Um die Fähigkeiten von GraphRAG auf den medizinischen Bereich auszudehnen, schlagen wir zwei spezifische Techniken vor: eine einzigartige Dreifach-Graph-Strukturierung und U-Retrieval. Bei der Graphenkonstruktion erstellen wir eine dreifach verknüpfte Struktur, die Benutzerdokumente mit vertrauenswürdigen medizinischen Quellen sowie kontrollierten Vokabularen verbindet. Im Retrieval-Prozess führen wir U-Retrieval ein, das eine Kombination aus top-down präziser Retrieval- und bottom-up Antwortverfeinerung darstellt, um eine Balance zwischen globaler Kontextbewusstheit und präziser Indizierung zu gewährleisten. Diese Ansätze ermöglichen sowohl die effiziente Rückgewinnung von Quelleninformationen als auch die umfassende Generierung von Antworten. Unser Ansatz wurde anhand von 9 medizinischen Q&A-Benchmarks, 2 Gesundheits-Fact-Checking-Benchmarks sowie einem eigenständig gesammelten Datensatz zur Generierung langformiger Inhalte validiert. Die Ergebnisse zeigen, dass MedGraphRAG über alle Benchmarks hinweg konsistent die derzeit besten Modelle übertrifft und gleichzeitig sicherstellt, dass die generierten Antworten mit glaubwürdigen Quellenangaben und Definitionsangaben versehen sind. Der Quellcode ist unter folgender URL verfügbar: this https URL.