التمثيل السياقي ووزن النموذج من خلال دمج المعرفة المجالية في الإجابة على الأسئلة الطبية الحيوية

الإجابة على الأسئلة الطبية البيولوجية تهدف إلى الحصول على إجابة للسؤال المطروح في مجال الطب البيولوجي. نظرًا لحاجتها العالية للمعرفة في هذا المجال، يصعب على النموذج تعلم المعرفة المتخصصة من بيانات التدريب المحدودة. نقترح طريقة تمثيل سياقية تجمع بين نموذج الإجابة على الأسئلة في المجالات المفتوحة (\aoa) ونموذج \biobert الذي تم تدريبه مسبقًا على بيانات مجال الطب البيولوجي. نعتمد التدريب غير المشرف على مكتبة كبيرة من البيانات الطبية البيولوجية والتدريب المشرف الدقيق على مجموعة بيانات الإجابة على الأسئلة الطبية البيولوجية. بالإضافة إلى ذلك، نستخدم طبقة وزن النماذج المستندة إلى الشبكة العصبية متعددة الطبقات (MLP) لاستغلال مزايا النموذجين بشكل آلي وتوفير الإجابة الصحيحة. يتم استخدام مجموعة البيانات العامة \biomrc التي تم بناؤها من مكتبة PubMed لتقييم طريقتنا. أظهرت النتائج التجريبية أن نموذجنا يتفوق بشكل كبير على نظام الحالة الراهنة الأكثر تقدمًا.