HyperAIHyperAI

Command Palette

Search for a command to run...

تعزيز النماذج التحويلية بتمثيلات متعددة الحبوب المركبة بشكل متكرر

Xiang Hu Qingyang Zhu Kewei Tu Wei Wu

الملخص

نقدم ReCAT، وهو نموذج Transformer مُحسَّن بتكوين متكرر قادر على نمذجة الهياكل النحوية الهرمية للنصوص الخام بشكل صريح دون الاعتماد على الأشجار الذهبية أثناء التعلم والاستدلال. تقتصر الأبحاث الحالية في هذا المجال على جعل البيانات تتبع هيكل شجرة هرمي، مما يفتقر إلى التواصل بين الفواصل. لحل هذه المشكلة، نقترح طبقة داخلية-خارجية سياقية (CIO) جديدة تتعلم تمثيلات سياقية للفواصل من خلال عمليات تصاعدية وهبوطية، حيث تقوم العملية التصاعدية بتكوين تمثيلات للفواصل المرتفعة عن طريق تركيب الفواصل المنخفضة، بينما تجمع العملية الهبوطية المعلومات داخل وخارج الفاصل. من خلال تكديس عدة طبقات CIO بين طبقة التضمين وطبقات الانتباه في Transformer، يمكن لنموذج ReCAT أن يقوم بالتفاعلات العميقة داخل الفواصل والتفاعلات العميقة بين الفواصل، وبالتالي إنتاج تمثيلات متعددة الحبيبات مُسَيَّقَة بالكامل مع باقي الفواصل. علاوة على ذلك، يمكن تدريب الطبقات الداخلية-الخارجية السياقية بشكل مشترك مع Transformers، مما يجعل ReCAT يتمتع بقدرة التوسع وأداءً قويًا وقابلية للتفسير في الوقت نفسه. نجري تجارب على مجموعة متنوعة من المهام المستوية عند الجملة والفواصل. تشير نتائج التقييم إلى أن ReCAT يمكنه تحقيق أداء أفضل بكثير من نماذج Transformer التقليدية في جميع المهام المستوية عند الفواصل ومن خطوط الأساس التي تدمج الشبكات المتكررة مع Transformers في مهام الاستدلال اللغوي الطبيعي. وبشكل أكثر إثارة للاهتمام، فإن الهياكل الهرمية التي تستنتجه ReCAT تظهر اتساقًا قويًا مع الأشجار النحوية التي تم تحديدها بواسطة البشر، مما يدل على القابلية للتفسير الجيدة التي توفرها الطبقات الداخلية-الخارجية السياقية (CIO).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp