الفهم المشترك للغة المنطوقة والنمذجة اللغوية باستخدام الشبكات العصبية التكرارية عبر الإنترنت

كشف نوايا المتحدث وملء الفتحات الدلالية هما مهمتان حاسمتان في فهم اللغة المنطوقة (SLU) لأنظمة الحوار. في هذا البحث، نصف نموذج شبكة عصبية متكررة (RNN) يقوم بشكل مشترك بكشف النوايا، ملء الفتحات، ونمذجة اللغة. يحافظ النموذج العصبي على تحديث تقدير النوايا مع وصول كل كلمة في العبارة المنقولة ويستخدمها كسمات سياقية في النموذج المشترك. تم تقييم نموذج نمذجة اللغة والنموذج المشترك لفهم اللغة المنطوقة على مجموعة بيانات المعايير ATIS. بالنسبة لمهمة نمذجة اللغة، حقق نموذجنا المشترك انخفاضًا نسبيًا بنسبة 11.8% في الالتباس مقارنة بنموذج نمذجة اللغة الذي تم تدريبه بشكل مستقل. فيما يتعلق بمهمات فهم اللغة المنطوقة، أظهر نموذجنا المشترك تفوقًا بنسبة 22.3% في معدل خطأ كشف النوايا، مع تدهور طفيف في درجة F1 لملء الفتحات. كما أظهر النموذج المشترك أداءً متميزًا في الإعدادات الواقعية لنظام التعرف على الكلام (ASR) مع إدخال الكلام الملوث بالضوضاء.