RAG الرسومية الطبية: نحو نموذج لغوي كبير طبي آمن من خلال التوليد المدعوم باسترجاع الرسومات

نُقدّم إطارًا جديدًا قائمة على الرسوم البيانية لتحسين التوليد المدعوم بالاسترجاع (RAG) مُصمم خصيصًا للنطاق الطبي، ويُسمّى \textbf{MedGraphRAG}، بهدف تعزيز قدرات نماذج اللغة الكبيرة (LLM) في إنتاج إجابات طبية مدعومة بالأدلة، مما يُحسّن من السلامة والموثوقية عند التعامل مع البيانات الطبية الحساسة. يعتمد النموذج القائم على الرسوم البيانية (GraphRAG) على استخدام نماذج اللغة الكبيرة لتنظيم بيانات RAG في هيكل رسومي، ويُظهر إمكانات كبيرة في استخلاص رؤى شاملة من الوثائق الطويلة. ومع ذلك، فإن التنفيذ القياسي لهذا النموذج معقّد جدًا للاستخدام العام، ولا يمتلك القدرة على إنتاج إجابات مدعومة بالأدلة، مما يحد من فعاليته في المجال الطبي. ولتوسيع قدرات GraphRAG في النطاق الطبي، نقترح تقنيتين فريدتين: بناء الرسم البياني الثلاثي (Triple Graph Construction) واسترجاع U (U-Retrieval). في عملية بناء الرسم البياني، نُنشئ هيكلًا مرتبطًا ثلاثيًا يربط بين الوثائق الخاصة بالمستخدم والمصادر الطبية الموثوقة والقواميس المُحكَمة. أما في عملية الاسترجاع، فإننا نقترح تقنية U-Retrieval التي تدمج بين الاسترجاع الدقيق من الأعلى إلى الأسفل (Top-down Precise Retrieval) وتحسين الاستجابة من الأسفل إلى الأعلى (Bottom-up Response Refinement)، بهدف تحقيق توازن بين الوعي بالسياق العام والدقة في الفهرسة. تُمكّن هذه المبادرات من استرجاع المعلومات المصدقة وتمكّن من توليد استجابات شاملة. وقد تم التحقق من أداء نهجنا على 9 معايير لأسئلة وأجوبة طبية، و2 معيار لفحص الحقائق الصحية، بالإضافة إلى مجموعة بيانات جُمعت لاختبار التوليد في النصوص الطويلة. أظهرت النتائج أن MedGraphRAG يتفوّق باستمرار على النماذج الرائدة في المجال على جميع المعايير، مع ضمان تضمين الاستجابات لمصادر موثوقة وتعريفات دقيقة. تم إتاحة الكود المصدر على: هذا الرابط.