نموذج تحليل الإطار الدلالي القائم على الشبكة العصبية التكرارية ثنائي النموذج للكشف عن النية وتعبئة الفتحات

اكتشاف النية وتعبئة الفتحات هي مهمتان رئيسيتان لبناء نظام فهم اللغة المنطوقة (SLU). أظهرت العديد من النماذج المستندة إلى التعلم العميق نتائج جيدة في هذه المهام. تعتبر الخوارزميات الأكثر فعالية هي التي تعتمد على هياكل نماذج التسلسل إلى تسلسل (أو نماذج "المشفّر-المفكك" (encoder-decoder))، وتولد النوايا والعلامات الدلالية إما باستخدام نماذج منفصلة أو نموذج مشترك. ومع ذلك، فإن معظم الدراسات السابقة إما تتعامل مع اكتشاف النية وتعبئة الفتحات كمهمتين منفصلتين متوازيتين، أو تستخدم نموذج تسلسل إلى تسلسل لإنتاج العلامات الدلالية والنوايا معاً. تعتمد معظم هذه الأساليب على نموذج واحد مستند إلى الشبكات العصبية (NN) (يشمل بنية المشفّر-المفكك) لنمذجة المهمتين، ولذلك قد لا تستفيد بشكل كامل من التأثير المتبادل بينهما. في هذا البحث، تم تصميم هياكل شبكة جديدة مستندة إلى النموذجين للشبكات المتكررة (RNN) لتنفيذ مهام اكتشاف النية وتعبئة الفتحات بشكل مشترك، وذلك بأخذ التأثير المتبادل بينهما بعين الاعتبار باستخدام LSTM ثنائية الاتجاهين مرتبطتين (BLSTM). حققت بنية النموذجين الخاصة بنا مع وجود مفكك أفضل نتيجة على بيانات ATIS القياسية، حيث تم تحسين دقة النية بنسبة حوالي 0.5٪ وتحسين تعبئة الفتحات بنسبة 0.9٪.