إطار تفاعلي رسم بياني ديناميكي مع إدخال معاني التسمية لفهم اللغة الشفهية

تحظى النماذج المُجمعة للكشف عن النوايا المتعددة وتعبئة الحقول (multi-intent detection and slot filling) باهتمام متزايد، نظرًا لقربها من السيناريوهات الواقعية المعقدة. ومع ذلك، فإن النهج الحالي يعاني من عيوب رئيسية: (1) يركّز على اكتشاف العلاقات الضمنية بين العبارات والوسوم ذات التشفير الواحد (one-hot encoded labels) في المهمتين، مع إغفال الخصائص الصريحة للوسوم؛ (2) يُدمج معلومات النوايا المتعددة مباشرة لكل رمز (token)، مما قد يؤدي إلى تنبؤات خاطئة بحقل التعبئة بسبب إدخال نوايا غير ذات صلة. في هذا البحث، نقترح إطارًا يُسمى DGIF، والذي يبدأ باستغلال المعلومات الدلالية للوسوم لتزويد النموذج بإشارات إضافية ونماذج أولية موسعة. ثم، يتم بناء رسم بياني تفاعلي متعدد الحُسْن (multi-grain interactive graph) لتمثيل العلاقات بين النوايا والحقول. وبشكل خاص، نقدّم منهجية جديدة لبناء هذا الرسم البياني استنادًا إلى دمج المعلومات الدلالية للوسوم، مما يسمح بتحديث تلقائي للرسم البياني لتحسين تقليل انتشار الأخطاء. أظهرت النتائج التجريبية أن إطارنا يتفوّق بشكل ملحوظ على النماذج الحالية، حيث حقق تحسنًا نسبيًا قدره 13.7% مقارنة بأفضل نموذج سابق على مجموعة بيانات MixATIS من حيث الدقة الشاملة.