HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

الكشف الكيميائي والفهرسة في مقالات نص كامل من PubMed باستخدام طرق التعلم العميق والقواعدية

{Sérgio Matos João Rafael Almeida João Figueira Silva Rui Antunes Tiago Almeida}

الملخص

تحديد المواد الكيميائية في الأدبيات العلمية الحيوية يعد مهمة أساسية في أبحاث تطوير الأدوية. وقد ساهمت مسابقة BioCreative NLM-Chem في تعزيز تطوير أنظمة آلية قادرة على تحديد المواد الكيميائية في المقالات الكاملة واتخاذ قرار بشأن المفاهيم الكيميائية ذات الصلة التي ينبغي فهرستها. يُقدّم هذا العمل مشاركة فريق BIT.UA التابع لجامعة أفيرو، حيث نقترح نموذجًا آليًا مكوّنًا من ثلاث مراحل يعالج بشكل منفصل: (أ) كشف الإشارات الكيميائية، (ب) توحيد الكيانات، و(ج) الفهرسة. وقد اعتمدنا حلًّا قائماً على التعلم العميق باستخدام نسخة معدلة من نموذج BERT مخصصة للعلوم الحيوية لتحديد المواد الكيميائية. أما في عملية التوحيد، فقد استخدمنا نهجًا قائمًا على القواعد، بالإضافة إلى نسخة هجينة تستخدم آلية استرجاع كثيفة. وبالمثل، في مجال الفهرسة، اتبعنا نهجين مختلفين: الأول قائم على القواعد، والثاني يستند إلى طريقة TF-IDF. وقد حققنا أفضل النتائج الرسمية في الثلاثة مهام الفرعية، حيث تفوقت نتائجنا بشكل مستمر على الوسيط الرسمي والمعيار المرجعي، بمقاييس F1 تبلغ على التوالي 0.8454 و0.8136 و0.4664.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
chemical-indexing-on-bc7-nlm-chemRule-based
F1-score (strict): 0.4664
entity-linking-on-bc7-nlm-chemSieve-based
F1-score (strict): 0.8136
named-entity-recognition-on-bc7-nlm-chemPubMedBERT+MLP+CRF
F1-score (strict): 0.8454

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp