{Amit Gautam Akshayraj M Priya Tiwary}
الملخص
الدافع: تُعد البيانات الطبية معقدة بطبيعتها، حيث تظهر المصطلحات في السجلات غالبًا في سياقات مختلفة. من خلال هذه الورقة البحثية، نستعرض تمثيلات النماذج الحيوية (BioBERT، BioELECTRA، PubMedBERT) فيما يتعلق بفهم السياقات الخاصة بالإنكار والتشكيك، ونكتشف أن هذه النماذج لم تتمكن من التمييز بين السياقات المُنْكَرة والساكنة. ولقياس مدى فهم النماذج، استخدمنا مقاييس التشابه الجيبي (cosine similarity) بين متجهات الجمل المُنْكَرة ومتجهات الجمل غير المُنْكَرة. ولتحسين هذه النماذج، نقدّم منهجية عامة للضبط المُتَقَدِّم (super-tuning) لتعزيز التمثيلات في سياقات الإنكار والتشكيك، وذلك باستخدام مجموعة بيانات مُصاغة (synthesized dataset).النتائج: بعد تطبيق الضبط المُتَقَدِّم على النماذج، أصبح من الواضح أن تمثيلات النماذج قد تحسّنت بشكل كبير في فهم السياقات المُنْكَرة والمشككة. علاوةً على ذلك، قمنا بضبط النماذج المُعَدَّة مسبقًا على مهام متعددة، ووجدنا أن النموذج قد تفوّق على النماذج السابقة، وحقق أداءً متقدمًا جدًا (SOTA) في مهام تحديد الإنكار، ومؤشرات التشكيك، وتحديد نطاق التأثير (scope detection) على مجموعتي بيانات BioScope والمسحات العلمية (Sherlock). كما تأكدنا من أن منهجيتنا تسبّب في تقليل كبير جدًا في التنازل (trade-off) في الأداء على مهام أخرى مثل الاستدلال اللغوي الطبيعي (Natural Language Inference) بعد الضبط المُتَقَدِّم.
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| negation-and-speculation-cue-detection-on | NegBioELECTRA | F1: 99.02 |
| negation-and-speculation-cue-detection-on-sem | NegBioELECTRA | F1: 99.56 |
| negation-scope-resolution-on-bioscope | NegBioELECTRA | F1: 98.94 |
| negation-scope-resolution-on-sem-2012-shared | NegBioELECTRA | F1: 97.26 |
| speculation-scope-resolution-on-bioscope | NegBioELECTRA | F1: 98.37 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.