HyperAIHyperAI
منذ 17 أيام

BioNLI: إنشاء مجموعة بيانات NLI طبية باستخدام قيود لكسيكو-الدلالية لإنشاء أمثلة معاكسة

Mohaddeseh Bastan, Mihai Surdeanu, Niranjan Balasubramanian
BioNLI: إنشاء مجموعة بيانات NLI طبية باستخدام قيود لكسيكو-الدلالية لإنشاء أمثلة معاكسة
الملخص

الاستدلال باللغة الطبيعية (NLI) أمر بالغ الأهمية لاتخاذ قرارات معقدة في المجال الطبي الحيوي. على سبيل المثال، أحد الأسئلة الأساسية هو ما إذا كان آلية طبية معينة مدعومة بالأدلة التجريبية. ويمكن اعتبار هذا السؤال مشكلة استدلال باللغة الطبيعية، لكن لا توجد بيانات جاهزة لمعالجة هذا النوع من المسائل. والتحدي الرئيسي يتمثل في صعوبة وتكاليف إنشاء أمثلة سلبية مفيدة يدويًا لهذه المهمة. نقدم طريقة نصف مُشرَّفة جديدة تقوم ببناء مجموعة بيانات لمشكلة الاستدلال باللغة الطبيعية من مجموعة بيانات طبية حيوية موجودة، تربط بين الآليات والدليل التجريبي الوارد في الملخصات. نُنشئ مجموعة متنوعة من الأمثلة السلبية باستخدام تسع استراتيجيات تُغيّر بنية الآليات الأساسية، باستخدام قواعد مثل عكس أدوار الكيانات في التفاعل، وأهم من ذلك، باستخدام اضطرابات عبر قيود منطقية في نظام فك تشفير عصبي. نستخدم هذه الطريقة لإنشاء مجموعة بيانات جديدة لمشكلة الاستدلال باللغة الطبيعية في المجال الطبي الحيوي، تُسمى BioNLI، ونُقيّم عليها اثنين من أحدث تصنيفات المجال الطبي الحيوي. ونحصل على أفضل نتيجة تصل إلى حوالي منتصف الـ70 في مؤشر F1، مما يشير إلى صعوبة المهمة. وبشكل حاسم، تختلف الأداء على الفئات المختلفة من الأمثلة السلبية بشكل كبير، من 97% في مؤشر F1 على الأمثلة السلبية البسيطة التي تتضمن تغييرًا في الأدوار، إلى أداء لا يتجاوز قليلاً ما هو متوقع بالصدفة على الأمثلة السلبية التي تم إنشاؤها باستخدام نظام الفك العصبي.