HyperAIHyperAI
منذ 2 أشهر

شبكات التعلم العميق جدًا للتصنيف النصي

Alexis Conneau; Holger Schwenk; Loïc Barrault; Yann Lecun
شبكات التعلم العميق جدًا للتصنيف النصي
الملخص

النهج السائد للكثير من مهام معالجة اللغة الطبيعية هو الشبكات العصبية التكرارية، وبشكل خاص LSTM، والشبكات العصبية التلافيفية. ومع ذلك، فإن هذه الهندسات تكون أسطح نسبيًا مقارنة بالشبكات التلافيفية العميقة التي رفعت مستوى الأداء في مجال الرؤية الحاسوبية. نقدم هنا هندسة جديدة (VDCNN) لمعالجة النصوص تعمل مباشرة على المستوى الحرف وتستخدم فقط عمليات تلافيف صغيرة وعمليات تجميع. نتمكن من إظهار أن أداء هذا النموذج يتحسن مع زيادة العمق: باستخدام ما يصل إلى 29 طبقة تلافيفية، نبلغ عن تحسينات على مستوى الأداء في عدة مهام تصنيف علني للنصوص. حسب علمنا، هذه هي المرة الأولى التي يتم فيها تطبيق شبكات عميقة جدًا تلافيفية على معالجة النصوص.

شبكات التعلم العميق جدًا للتصنيف النصي | أحدث الأوراق البحثية | HyperAI