منذ 2 أشهر
شبكات التعلم العميق جدًا للتصنيف النصي
Alexis Conneau; Holger Schwenk; Loïc Barrault; Yann Lecun

الملخص
النهج السائد للكثير من مهام معالجة اللغة الطبيعية هو الشبكات العصبية التكرارية، وبشكل خاص LSTM، والشبكات العصبية التلافيفية. ومع ذلك، فإن هذه الهندسات تكون أسطح نسبيًا مقارنة بالشبكات التلافيفية العميقة التي رفعت مستوى الأداء في مجال الرؤية الحاسوبية. نقدم هنا هندسة جديدة (VDCNN) لمعالجة النصوص تعمل مباشرة على المستوى الحرف وتستخدم فقط عمليات تلافيف صغيرة وعمليات تجميع. نتمكن من إظهار أن أداء هذا النموذج يتحسن مع زيادة العمق: باستخدام ما يصل إلى 29 طبقة تلافيفية، نبلغ عن تحسينات على مستوى الأداء في عدة مهام تصنيف علني للنصوص. حسب علمنا، هذه هي المرة الأولى التي يتم فيها تطبيق شبكات عميقة جدًا تلافيفية على معالجة النصوص.