قياس التشابه الدلالي للنتائج السريرية باستخدام تمثيلات اللغة المُدرّبة مسبقًا العميقية
الخلفية: تمثل النتائج المتغيرات التي يتم مراقبتها خلال التجربة السريرية لتقييم الأثر الذي تحدثه التدخلات على صحة الإنسان. وتُعد التقييم التلقائي للتشابه الدلالي بين النتائج السريرية ضروريًا لعدد من المهام، مثل اكتشاف تبديل النتائج (أي التغيرات غير المبررة في النتائج المحددة مسبقًا لتجربة سريرية)، وتطبيق مجموعات النتائج الأساسية (أقل مجموعة من النتائج التي ينبغي الإبلاغ عنها في مجال طبي معين).الهدف: كان هدفنا بناء خوارزمية لتقييم التشابه الدلالي بين أزواج من النتائج الأساسية والإبلاغ عنها. وركزنا على الأساليب التي لا تتطلب موارد مخصصة للحقل تم تجميعها يدويًا، مثل المفردات المفاهيمية (Ontologies) وموسوعات المفردات (Thesauri).الطرق: قمنا باختبار عدة أساليب، تشمل مقاييس التشابه الفردية (المبنية على السلاسل النصية، الجذور والجذور الأساسية، المسارات والمسافات داخل المفردات المفاهيمية، والتمثيلات المتجهة للعبارات)، وتصنيفات تعتمد على دمج مقاييس التشابه الفردية كخصائص، وأسلوب تعلم عميق يتضمن تحسينًا دقيقًا (Fine-tuning) لتمثيلات اللغة المُدرّبة مسبقًا. وتم اختبار نماذج لغوية مقدمة من BERT (مُدرّبة على نصوص عامة)، وBioBERT وSciBERT (مُدرّبة على نصوص طبية وعلمية على التوالي). كما استكشفنا إمكانية تحسين النتائج من خلال أخذ البدائل الممكنة للإشارة إلى نتيجة معينة بعين الاعتبار (مثل استخدام اسم أداة القياس بدلًا من اسم النتيجة، أو استخدام الاختصارات). وقمنا بالإفصاح عن مجمع نصوص مفتوح يحتوي على ترميزات تُظهر التشابه بين أزواج النتائج.النتائج: تفوقت التصنيفات التي تعتمد على دمج مقاييس التشابه الفردية كخصائص على المقاييس الفردية وحدها، في حين تفوقت خوارزميات التعلم العميق التي تعتمد على نماذج BioBERT وSciBERT على التصنيفات. وحققت BioBERT أفضل قياس لـ F قدره 89.75%. ولم يُحسّن إضافة البدائل الممكنة للنتائج النتائج بالنسبة لأفضل مقاييس التشابه الفردية أو للتصنيفات، لكنها ساهمت في تحسين أداء خوارزميات التعلم العميق: حيث وصلت BioBERT إلى قياس F قدره 93.38%.الاستنتاج: تفوقت أساليب التعلم العميق التي تعتمد على تمثيلات لغوية مُدرّبة مسبقًا على الأساليب الأخرى في تقييم التشابه الدلالي للنتائج السريرية، دون الاعتماد على أي موارد مخصصة للحقل تم تجميعها يدويًا (مثل المفردات المفاهيمية أو الموارد اللفظية الأخرى). كما أدى إضافة البدائل الممكنة للنتائج إلى تحسين أداء خوارزميات التعلم العميق بشكل إضافي.