HyperAIHyperAI
منذ 17 أيام

مقارنة بين طرق واستخلاص العلاقات الطبية ونماذجها لإنشاء رسم معرفي

Nikola Milosevic, Wolfgang Thielemann
مقارنة بين طرق واستخلاص العلاقات الطبية ونماذجها لإنشاء رسم معرفي
الملخص

تتقدم الأبحاث الطبية الحيوية بسرعة هائلة، بحيث أصبح من المستحيل على العلماء والباحثين والممارسين مواكبة الكمية الهائلة من الأدبيات المنشورة في هذا المجال. ويتطلب المعرفة المقدمة في هذه الأدبيات تنظيمًا منهجيًا يتيح العثور بسهولة على الادعاءات والفرضيات، ووصولًا إليها، وتحققها. يمكن لخرائط المعرفة أن تقدم إطارًا مناسبًا لتمثيل المعرفة الدلالية المستمدة من الأدبيات. ولكن لبناء خريطة معرفية، من الضروري استخراج المعرفة على شكل علاقات بين الكيانات الطبية الحيوية، وتوحيد كل من الكيانات وأنواع العلاقات. في هذه الورقة، نقدم ونقارن بين عدة طرق قائمة على القواعد، وأخرى تعتمد على التعلم الآلي (مثل خوارزمية بايز البسيطة، وغابات العشوائية كأمثلة على طرق التعلم الآلي التقليدية، ونماذج DistilBERT، وPubMedBERT، وT5، وSciFive كأمثلة على نماذج التحولات العميقة الحديثة) لاستخراج العلاقات على نطاق واسع من الأدبيات الطبية الحيوية، ودمجها في خرائط المعرفة. وندرس مدى مرونة هذه الأساليب المختلفة أمام مجموعات بيانات غير متوازنة وصغيرة نسبيًا. تُظهر تجاربنا أن النماذج القائمة على التحولات (Transformers) تتعامل بشكل جيد مع كلا النوعين من البيانات: الصغيرة (بفضل التدريب المسبق على مجموعات بيانات ضخمة)، والغير متوازنة. وكانت أفضل نموذج أداءً هو نموذج PubMedBERT الذي تم تحسينه على بيانات متوازنة، وحقق مقياس F1 قدره 0.92. تلاه نموذج DistilBERT بقيمة F1 قدرها 0.89، حيث أظهر أداءً أسرع واستهلاكًا أقل للموارد. وتفوقت النماذج القائمة على BERT على النماذج التوليدية القائمة على T5.