HyperAIHyperAI
منذ 18 أيام

إثراء الدلالة لنتائج التضمين المُدرَّب مسبقًا في التعلّم غير المُشرَّف للبحث المعلوماتي

{Giorgos Stamou, Chrysoula Zerva, Alexios Mandalios, Konstantinos Thomas, Giorgos Filandrianos, Edmund Dervakos}
إثراء الدلالة لنتائج التضمين المُدرَّب مسبقًا في التعلّم غير المُشرَّف للبحث المعلوماتي
الملخص

شهد النمو السريع للآداب العلمية في المجالات الحيوية والسريرية تفاقمًا كبيرًا في عملية تحديد المعلومات ذات الاهتمام من قبل الباحثين والمهنيين الآخرين. وبشكل أكثر أهمية، فإن الظهور السريع للمواضيع والنتائج الجديدة غالبًا ما يعيق أداء النماذج المُدرَّبة بطرق مُراقبة، وذلك بسبب نقص البيانات المُعلَّمة ذات الصلة. وسلطت الجائحة العالمية لفيروس كوفيد-19 الضوء بشكل خاص على الحاجة إلى طرح أسئلة واستكشاف مناطق غير مُستكشفة في الأدبيات العلمية بطريقة سريعة وفعّالة.في هذه الورقة، نستعرض إمكانات تعزيز النماذج العميقة المبنية على معمارية الترانسفورمر من خلال استخدام SNOMED-CT بهدف الإجابة على استفسارات المستخدمين بطريقة غير مُراقبة. يهدف النظام المقترح إلى تنقية و重新 ترتيب المستندات المرتبطة باستفسار معين، والتي تم استردادها أولًا باستخدام نماذج BERT. لتحقيق ذلك، نُعزز الاستفسارات والمستندات بمفاهيم SNOMED-CT، ثم نطبّق قواعد تصفية قائمة على التواجد المشترك للمفاهيم بينهما. وقد قُمنا بتقييم هذا النهج على مجموعة بيانات OHSUMED، ونُظهر أداءً تنافسيًا، كما نقدّم منهجنا لتكيف هذا النهج مع المستندات الكاملة، مثل تحدي مجموعة بيانات CORD-19 الكاملة من كاغل (Kaggle).