HyperAIHyperAI
منذ 17 أيام

فهم أعمق للوثائق السريرية باستخدام استخراج العلاقات

Hasham Ul Haq, Veysel Kocaman, David Talby
فهم أعمق للوثائق السريرية باستخدام استخراج العلاقات
الملخص

يُشكّل الازدياد المتسارع في كميات الأدبيات الطبية الحيوية وسجلات السريرية الرقمية حاجة متزايدة لتقنيات استخراج النصوص التي لا تقتصر على تحديد الكيانات، بل تمكّن أيضًا من ربطها دلاليًا في البيانات غير المنظمة. في هذه الورقة، نُقدّم إطارًا لاستخراج النصوص يتضمن نماذج التعرف على الكيانات الاسمية (NER) واستخراج العلاقات (RE)، والذي يُعدّ توسّعًا على العمل السابق في ثلاث جوانب رئيسية. أولاً، نقدّم معمليين جديدين لنموذج استخراج العلاقات — نموذج يُحسّن الدقة باستخدام BioBERT، ونموذج يُحسّن السرعة من خلال استخدام ميزات مصممة خصيصًا على شبكة عصبية متصلة بالكامل (FCNN). ثانيًا، نُقيّم كلا النموذجين على مجموعات بيانات معيارية عامة، ونحقق أداءً جديدًا في مستوى الحالة الراهنة (SOTA) من حيث مؤشر F1 في عدة تحديات: تحدي العلاقات الزمنية السريرية i2b2 لعام 2012 (F1 = 73.6، بزيادة 1.2% عن الحالة السابقة)، وتحدي العلاقات السريرية i2b2 لعام 2010 (F1 = 69.1، بزيادة 1.2%)، وبيانات العلاقات بين الفينوتايب والجينات لعام 2019 (F1 = 87.9، بزيادة 8.5%)، وبيانات تفاعلات الأدوية السلبية (Adverse Drug Events) لعام 2012 (F1 = 90.0، بزيادة 6.3%)، وبيانات العلاقات الدوائية (Posology Relations) لعام 2018 (F1 = 96.7، بزيادة 0.6%). ثالثًا، نُظهر تطبيقين عمليين لهذا الإطار: بناء رسم معرفي طبي، وتحسين دقة تعيين الكيانات إلى الرموز السريرية. تم بناء النظام باستخدام مكتبة Spark NLP، التي توفر إطارًا متقدمًا لمعالجة اللغة الطبيعية (NLP) مُصممًا للبيئات الإنتاجية، ومتاحًا للتوسع بشكل طبيعي، مُحسّنًا من حيث الأداء على مستوى الأجهزة، قابلًا للتدريب والضبط الدقيق.

فهم أعمق للوثائق السريرية باستخدام استخراج العلاقات | أحدث الأوراق البحثية | HyperAI