MedTSS: تحويل تلخيص المقالات العلمية الاستخلاصية من خلال التحليل اللغوي وتعزيز المفاهيم
تتناول هذه الدراسة القيود المفروضة على النماذج المُدرّبة مسبقًا (PTMs) في إنتاج ملخصات استخلاصية دقيقة وشاملة للمقالات العلمية، مع التركيز المحدد على التحديات التي تفرضها الأبحاث الطبية. ويُقدّم الحل المقترح، المُسمّى بتبسيط النص الطبي وملخصه (MedTSS)، وحدة مخصصة مصممة لتحسين النص المُدخل بالنسبة للنماذج المُدرّبة مسبقًا. يعالج MedTSS مشكلات تتعلق بحدود عدد الرموز (token limits)، ويعزز مفاهيم متعددة، ويقلل من مشكلة التصوّر الخاطئ للمخلّفات (entity hallucination) دون الحاجة إلى تدريب إضافي. علاوةً على ذلك، تقوم الوحدة بتحليل لغوي لتبسيط الملخصات المُنتجة، خصوصًا بما يتناسب مع الطبيعة المعقدة للمقالات البحثية الطبية. وقد أظهرت النتائج تحسينًا كبيرًا، حيث رفعت من قيمة مقياس Rouge-1 من 16.46 إلى 35.17 دون الحاجة إلى تدريب إضافي. وبتركيزها على العناصر القائمة على المعرفة، يقدّم هذا الإطار رؤية متميزة، ويتحدى السرد الشائع المتمثل في "مزيد من البيانات" أو "مزيد من المعاملات". ويمثل هذا النهج البديل، الذي ينطبق بشكل خاص على المجالات المتعلقة بالصحة، إسهامًا واسع النطاق في مجال معالجة اللغة الطبيعية (NLP). ويُعدّ MedTSS نموذجًا مبتكرًا لا يعالج فقط تعقيدات ملخصات الأبحاث الطبية، بل يُقدّم أيضًا تحولًا نموذجيًا له آثار في مجالات متنوعة تتجاوز نطاقه الأصلي.