HyperAIHyperAI
منذ 11 أيام

طبقات الفضاء الحالة المبسطة للنمذجة التسلسلية

Jimmy T.H. Smith, Andrew Warrington, Scott W. Linderman
طبقات الفضاء الحالة المبسطة للنمذجة التسلسلية
الملخص

النماذج التي تعتمد على طبقات الحالة المُنظَّمة في التسلسل (S4) حققت أداءً متقدمًا في المهام المتعلقة بتمثيل التسلسلات الطويلة. تجمع طبقة S4 بين النماذج الخطية للفضاء الحالة (SSMs)، وإطار العمل HiPPO، والتعلم العميق لتحقيق أداء عالي. نبني على تصميم طبقة S4 ونُقدِّم طبقة فضاء حالة جديدة تُسمى طبقة S5. في حين أن طبقة S4 تستخدم العديد من النماذج الخطية للفضاء الحالة (SSMs) المستقلة ذات المدخلات والمخرجات الواحدة، فإن طبقة S5 تستخدم نموذجًا واحدًا للفضاء الحالة متعدد المدخلات ومتعدد المخرجات. قمنا ب Establishment علاقة بين S5 وS4، واستخدمنا هذه العلاقة لتطوير طريقة التهيئة والتمثيل المعاملات المستخدمة في نموذج S5. النتيجة هي طبقة فضاء حالة يمكنها الاستفادة من عمليات المسح المتوازية الفعالة والمنتشرة على نطاق واسع، مما يسمح لـ S5 بتحقيق كفاءة حسابية مماثلة لـ S4، مع تحقيق أداءً متقدمًا في عدة مهام تمثيل التسلسلات الطويلة. وبلغ متوسط أداء S5 87.4% في معيار Long Range Arena، و98.5% في المهمة الأصعب Path-X.

طبقات الفضاء الحالة المبسطة للنمذجة التسلسلية | أحدث الأوراق البحثية | HyperAI