مِيداس: التعلم المُتَعَلِّمِي متعدد المستويات للنية، والنطاق، وملء الفراغات في معالجة اللغة الطبيعية متعددة الدورات

على الرغم من أن النماذج اللغوية الكبيرة (LLMs) قادرة على إنتاج نص متماسك، إلا أنها غالبًا ما تواجه صعوبات في التعرف على نية المستخدم وراء الاستفسارات. في المقابل، تُفسِّر نماذج فهم اللغة الطبيعية (NLU) الغرض والمعلومات الأساسية المُدخلة من قبل المستخدم لتمكين التفاعل الاستجابة. تُعَدّ النماذج الحالية لـ NLU عادةً تُرجمة العبارات إلى إطار معنوي ثنائي المستويات، يشمل تصنيف النية على مستوى الجملة (SI) وتصنيف الحقول (WS) على مستوى الكلمات. ومع ذلك، فإن المحادثات الحقيقية تتكون في الغالب من محادثات متعددة الدورات، مما يتطلب تفسيرًا للتفاعلات المعقدة والمتواصلة. ويواجه الباحثون صعوبات في معالجة جميع جوانب المحادثات المتعددة الدورات باستخدام نموذج NLU موحد. تقدّم هذه الورقة منهجًا جديدًا يُسمّى MIDAS، يستخدم استخلاص المعرفة على مستويات متعددة للنوايا والمناهج والحقول لفهم نوايا المحادثات متعددة الدورات. نقوم ببناء مدرّسين مختلفين للكشف عن النية على مستوى الجملة (SI)، وملء الحقول (WS)، وتصنيف المجال على مستوى المحادثة (CD)، وكل مدرّس يتم تدريبه بدقة على نوع معين من المعرفة. كما نقترح خسارة متعددة المدرّسين لتسهيل دمج هذه المدرّسين، وتوجيه نموذج الطالب في مهام المحادثات متعددة الدورات. تُظهر النتائج فعالية نموذجنا في تحسين فهم المحادثات متعددة الدورات، وتكشف عن الإمكانات الكامنة في تطوير NLU من خلال استخلاص معرفة المحادثات متعددة المستويات. تم إتاحة التنفيذ المُقدم مفتوح المصدر عبر الرابط: https://github.com/adlnlp/Midas.