مجموعة بيانات لاستخراج العلاقات النائية بين مركبات الأدوية

لقد أصبحت العلاجات المتعددة الأدوية المعيار الرئيسي في علاج الأمراض مثل السرطان ومرض السل والملاريا وفيروس نقص المناعة البشرية (HIV). ومع ذلك، فإن مجموعة العلاجات المتعددة الأدوية المتاحة تشكل تحديًا في تحديد العلاجات الفعالة المتاحة في أي وضع. لمساعدة المهنيين الصحيين في تحديد مجموعات الأدوية المفيدة، قمنا ببناء مجموعة بيانات تم توثيقها من قبل خبراء لاستخراج المعلومات حول فعالية مجموعات الأدوية من الأدبيات العلمية. بالإضافة إلى فائدتها العملية، تقدم هذه المجموعة البيانات تحديًا فريدًا في مجال معالجة اللغات الطبيعية (NLP)، حيث أنها أول مجموعة بيانات لاستخراج العلاقات تتكون من علاقات ذات أطوال متغيرة. علاوة على ذلك، تتطلب معظم العلاقات في هذه المجموعة البيانات فهمًا للغة يتجاوز مستوى الجملة، مما يضيف إلى صعوبة هذه المهمة. نحن نوفر نموذجًا أساسيًا واعدًا ونحدد مجالات واضحة للتحسين المستقبلي. لقد أطلقنا مجموعتنا البيانات والكود والنماذج الأساسية بشكل عام لتشجيع مجتمع معالجة اللغات الطبيعية على المشاركة في هذه المهمة.