HyperAIHyperAI
منذ 2 أشهر

من تسمية الأجزاء من الكلام إلى تحليل الارتباطات لاستخراج الأحداث البيولوجية الطبية

Dat Quoc Nguyen; Karin Verspoor
من تسمية الأجزاء من الكلام إلى تحليل الارتباطات لاستخراج الأحداث البيولوجية الطبية
الملخص

الخلفية: نظرًا لأهمية استخراج العلاقات أو الأحداث من المنشورات البحثية الطبية الحيوية لدعم التقاط المعرفة ودمجها، والاعتماد الشديد للطرق المستخدمة في هذه المهمة على المعلومات النحوية، فمن القيمة فهم أي طرق المعالجة النحوية للنصوص الطبية الحيوية تتمتع بأعلى الأداء. النتائج: نقوم بدراسة تجريبية مقارنة بين أحدث النماذج التقليدية القائمة على الخصائص والنماذج القائمة على الشبكات العصبية لمهام معالجة اللغة الطبيعية الأساسية وهي تصنيف الأدوار النحوية (POS tagging) وتحليل الارتباط (dependency parsing) على مجموعتين مرجعيتين من البيانات الطبية الحيوية وهما GENIA و CRAFT. حسب علمنا، لا يوجد عمل حديث يجري مثل هذه المقارنات في السياق الطبي الحيوي؛ وبشكل خاص لا تتوفر تحليلات مفصلة للنماذج العصبية على هذه البيانات. أظهرت نتائج التجارب أن النماذج العصبية بشكل عام تتفوق على النماذج القائمة على الخصائص في كلتا المجموعتين المرجعيتين من البيانات الطبية الحيوية GENIA و CRAFT. كما قمنا بتقييم موجه نحو المهمة لفحص تأثيرات هذه النماذج في تطبيق لاحق لاستخراج الأحداث الطبية الحيوية، وأظهرنا أن الأداء الجيد في التحليل الداخلي لا يعني دائمًا أداءً جيدًا في استخراج الأحداث الخارجية.الاستنتاج: قدمنا دراسة تجريبية مفصلة مقارنة بين النماذج التقليدية القائمة على الخصائص والنماذج القائمة على الشبكات العصبية لتصنيف الأدوار النحوية وتحليل الارتباط في السياق الطبي الحيوي، كما فحصنا تأثير اختيار المحرك التحليلي لمهمة استخراج الأحداث الطبية الحيوية اللاحقة.توافر البيانات والمادة: نوفر النماذج التي تم إعادة تدريبها عبر الرابط https://github.com/datquocnguyen/BioPosDep

من تسمية الأجزاء من الكلام إلى تحليل الارتباطات لاستخراج الأحداث البيولوجية الطبية | أحدث الأوراق البحثية | HyperAI