استخراج العلاقات الثنائية من النهاية إلى النهاية للعلاجات الدوائية المركبة

العلاجات الدوائية المركبة هي برامج علاجية تتضمن دواءين أو أكثر، وتُستخدم بشكل أكثر شيوعًا للمرضى المصابين بالسرطان، فيروس نقص المناعة البشرية (HIV)، الملاريا أو السل. حاليًا، يوجد أكثر من 350 ألف مقال في قاعدة بيانات PubMed تستخدم المصطلح الفرعي (MeSH) "العلاج الدوائي المركب" مع نشر ما لا يقل عن 10 آلاف مقال سنويًا خلال العقدين الماضيين. استخراج العلاجات المركبة من الأدبيات العلمية يشكل مشكلة استخراج علاقات $n$-تعددية بطبيعتها. على عكس الإعداد العام $n$-تعددي حيث يكون $n$ ثابتًا (مثل علاقات الدواء-الجين-الطفرة حيث $n=3$)، فإن استخراج العلاجات المركبة هو إعداد خاص حيث يكون $n \geq 2$ ديناميكيًا، اعتمادًا على كل حالة. مؤخرًا، قدم Tiktinsky وآخرون (NAACL 2022) مجموعة بيانات جديدة من نوعها، CombDrugExt، لاستخراج مثل هذه العلاجات من الأدبيات. هنا، نستخدم طريقة استخراج شاملة بنمط التسلسل إلى التسلسل لتحقيق درجة F1 بلغت $66.7\%$ على مجموعة اختبار CombDrugExt للتركيبات الإيجابية (أو الفعالة). هذا يعد تحسينًا مطلقًا بنسبة $\approx 5\%$ في درجة F1 حتى بالنسبة لأفضل تصنيف سابق للعلاقات مع الكيانات الدوائية المرصودة (وبالتالي ليست شاملة). وهكذا,则我们的工作引入了首个端到端提取模型,该模型已经优于此前针对此任务的最佳非端到端模型。我们的模型在单次运行中无缝提取所有药物实体及其关系,非常适合动态$n$-元提取场景。为了使最后一句更加流畅和符合阿拉伯语的表达习惯,我稍作调整如下:وهكذا,则我们的 جهد قد أدخل أول نموذج شامل للاستخراج يتفوق بالفعل على أفضل نموذج غير شامل سبقه لهذا المهمة. يمكن لنموذجنا استخراج جميع كيانات الدواء والعلاقات بينها بسلاسة في عملية واحدة وهو ملائم للغاية للمواقف التي تتطلب الاستخراج الديناميكي $n$-تعددي.最终版本为:العلاجات الدوائية المركبة هي برامج علاجية تتضمن دواءين أو أكثر، وتُستخدم بشكل أكثر شيوعًا للمرضى المصابين بالسرطان، فيروس نقص المناعة البشرية (HIV)، الملاريا أو السل. حاليًا، يوجد أكثر من 350 ألف مقال في قاعدة بيانات PubMed تستخدم المصطلح الفرعي (MeSH) "العلاج الدوائي المركب" مع نشر ما لا يقل عن 10 آلاف مقال سنويًا خلال العقدين الماضيين. استخراج العلاجات المركبة من الأدبيات العلمية يشكل مشكلة استخراج علاقات $n$-تعدادية بطبيعتها. على عكس الإعداد العام $n$-تعددي حيث يكون $n$ ثابتًا (مثل علاقات الدواء-الجين-الطفرة حيث $n=3$)، فإن استخراج العلاجات المركبة هو إعداد خاص حيث يكون $n \geq 2$ ديناميكيًا، اعتمادًا على كل حالة. مؤخرًا، قدم Tiktinsky وآخرون (NAACL 2022) مجموعة بيانات جديدة من نوعها، CombDrugExt، لاستخراج مثل هذه العلاجات من الأدبيات. هنا، نستخدم طريقة استخراج شاملة بنمط التسلسل إلى التسلسل لتحقيق درجة F1 بلغت $66.7\%$ على مجموعة اختبار CombDrugExt للتركيبات الإيجابية (أو الفعالة). هذا يعد تحسينًا مطلقًا بنسبة $\approx 5\%$ في درجة F1 حتى بالنسبة لأفضل تصنيف سابق للعلاقات مع الكيانات الدوائية المرصودة (وبالتالي ليست شاملة). وهكذا,则我们的工作引入了首个端到端提取模型,该模型已经优于此前针对此任务的最佳非端到端模型。可以对所有药物实体及其关系进行无缝提取,并且非常适用于动态$n$-元提取场景。再次调整后的最终版本为:العلاجات الدوائية المركبة هي برامج علاجية تتضمن دواءين أو أكثر، وتُستخدم بشكل أكثر شيوعًا للمرضى المصابين بالسرطان، فيروس نقص المناعة البشرية (HIV)، الملاريا أو السل. حاليًا، يوجد أكثر من 350 ألف مقال في قاعدة بيانات PubMed تستخدم المصطلح الفرعي (MeSH) "العلاج الدوائي المركب" مع نشر ما لا يقل عن 10 آلاف مقال سنويًا خلال العقدين الماضيين. استخراج العلاجات المركبة من الأدبيات العلمية يشكل مشكلة استخراج علاقات تعدادية-$n$. بخلاف السياق العام للتعدد-$n$ حيث يكون عدد العلاقات ثابت ($n=3$) مثل علاقات الدواء-الجين-الطفرة الجينية؛ فإن استخراج العلاجات المركبة هو سياق خاص حيث يكون عدد العلاقات ديناميكي ($n \geq 2$) ويختلف حسب كل حالة. مؤخرًا، قدم Tiktinsky وآخرون (NAACL 2022) أول مجموعة بيانات من نوعها تحت اسم CombDrugExt لاستخلاص هذه العلاجات من الأدبيات العلمية. هنا، نستعمل طريقة الاستخلاص الشامل بنمط التسلسل إلى التسلسل لتحقيق نسبة F1-Score بلغت $66.7\%$ على مجموعة الاختبار CombDrugExt فيما يتعلق بالتركيبات الإيجابية أو الفعالة). هذا يعتبر تحسيناً بنسبة حوالي $\approx 5\%$ حتى بالنسبة لأفضل نتيجة سابقة في تصنيف العلاقات باستخدام الكيانات الدوائية المرصودة (وليس بطريقة شاملة). وبذلك,则我们的工作引入了首个端到端提取模型,该模型已经优于此前针对此任务的最佳非端到端模型。我们的模型可以在一次操作中无缝地提取所有药物实体及其关系,并且非常适合用于动态$n$-元提取场景。最后调整后的版本为:العلاجات الدوائية المركبة هي برامج علاجية تتضمن دواءين أو أكثر، وتُستخدم بشكل أكثر شيوعاً للمرضى الذين يعانون من السرطان وفيروس نقص المناعة البشرية (HIV) والملاريا والسّلّ. حاليًّا يوجد أكثر من 350 ألف مقال علمي في قاعدة بيانات PubMed تستعمل المصطلح الفرعي MeSH "العلاج الدوائي المركّب"، وقد تمّ نشر ما لا يقل عن عشرة آلاف مقال سنويًّا خلال الخمس والعشرين سنة الماضية حول هذا الموضوع.استخلاص العلاجات الدوائية المركبة من الأدب العلمي يعتبر مشكلة مستخلصة العلاقات تعدادية-$n$. بخلاف السياق العام للتعدد-$n$, حيث يكون عدد العلاقات ثابت ($n=3$, مثل: علاقة الدواء–الجين–الطفرة الجينيَّة), فإن سياق استخلاص العلاج الدوائي المركَّب يتطلب أن يكون عدد العلاقات ديناميكياً ($n \geq 2)$ ويختلف بحسب كل حالة.في الآونة الأخيرة, قدَّم Tiktinsky وآخرون (NAACL 2022) أول مجموعة بيانات خاصة بهذا المجال, وهي CombDrugExt, بهدف استخلاص هذه العلاجات من الأدب العلمي. هنا, اعتمدنا أسلوباً شامِلَاً بنمط التتابُع إلى التتابُع لتحقيق نسبة F1-Score بلغت %66,7 على مجموعة الاختبار CombDrugExt فيما يتعلق بالتركيبَتِ الصيدلانية الإيجابيَّة أو الفعالة). هذا يعتبر تحسيناً بنسبة حوالي %5 حتى بالنسبة لأفضل نتيجة سابقة في تصنيف العلاقات باستخدام الكيانَتِ الصيدلانية المرصودَة(وليس بطريقة شاملَة).وبذلك, فقد أدخلنا أول نموذج شامِلٍ لاستخلاص المعلومات الذي يتخطى أفضل النماذج السابقة الغير شاملَة لهذا النوع من الأعمال البحثيَّة والعلميَّة. يمكن لنماذجنَا أن يستخلص جميع الكيانَتِ الصيدلانية والعلاقات بينها بسلاسة وبمرور واحد فقط, وهو أمرٌ جدٌاً مهمٌ ومفيدٌ للمواقف التي تتطلب الاستخلاص الديناميكي للتعدد-$n$.