HyperAIHyperAI

Command Palette

Search for a command to run...

من تسمية الأجزاء من الكلام إلى تحليل الارتباطات لاستخراج الأحداث البيولوجية الطبية

Dat Quoc Nguyen Karin Verspoor

الملخص

الخلفية: نظرًا لأهمية استخراج العلاقات أو الأحداث من المنشورات البحثية الطبية الحيوية لدعم التقاط المعرفة ودمجها، والاعتماد الشديد للطرق المستخدمة في هذه المهمة على المعلومات النحوية، فمن القيمة فهم أي طرق المعالجة النحوية للنصوص الطبية الحيوية تتمتع بأعلى الأداء. النتائج: نقوم بدراسة تجريبية مقارنة بين أحدث النماذج التقليدية القائمة على الخصائص والنماذج القائمة على الشبكات العصبية لمهام معالجة اللغة الطبيعية الأساسية وهي تصنيف الأدوار النحوية (POS tagging) وتحليل الارتباط (dependency parsing) على مجموعتين مرجعيتين من البيانات الطبية الحيوية وهما GENIA و CRAFT. حسب علمنا، لا يوجد عمل حديث يجري مثل هذه المقارنات في السياق الطبي الحيوي؛ وبشكل خاص لا تتوفر تحليلات مفصلة للنماذج العصبية على هذه البيانات. أظهرت نتائج التجارب أن النماذج العصبية بشكل عام تتفوق على النماذج القائمة على الخصائص في كلتا المجموعتين المرجعيتين من البيانات الطبية الحيوية GENIA و CRAFT. كما قمنا بتقييم موجه نحو المهمة لفحص تأثيرات هذه النماذج في تطبيق لاحق لاستخراج الأحداث الطبية الحيوية، وأظهرنا أن الأداء الجيد في التحليل الداخلي لا يعني دائمًا أداءً جيدًا في استخراج الأحداث الخارجية.الاستنتاج: قدمنا دراسة تجريبية مفصلة مقارنة بين النماذج التقليدية القائمة على الخصائص والنماذج القائمة على الشبكات العصبية لتصنيف الأدوار النحوية وتحليل الارتباط في السياق الطبي الحيوي، كما فحصنا تأثير اختيار المحرك التحليلي لمهمة استخراج الأحداث الطبية الحيوية اللاحقة.توافر البيانات والمادة: نوفر النماذج التي تم إعادة تدريبها عبر الرابط https://github.com/datquocnguyen/BioPosDep


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp