HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

تخفيف نماذج المُحَوِّل باستخدام تجميع تمثيل قابل للتدريب

{Anonymous}

الملخص

نُقدِّم طريقة جديدة لاستخدام التمثيلات النادرة للانتباه في نموذج الترانسفورمر من خلال تعلُّم اختيار تمثيلات الرموز الأكثر إفادة خلال عملية التدريب، وبالتالي التركيز على الأجزاء الخاصة بالمهام في المدخلات. تم تحقيق خفض في التعقيد الزمني والذاكرة من الدرجة التربيعية إلى تحت الخطية بفضل عملية اختيار القمة القابلة للتدريب المُحكمة لـ kkk. تُظهر تجاربنا على مهمة صعبة لاستخلاص ملخصات الوثائق الطويلة أن حتى الأساس البسيط لدينا يُحقق أداءً يُنافس الحالة الراهنة للحالة المثلى (SOTA)، وباستخدام عملية تجميع قابلة للتدريب، يمكن الحفاظ على الجودة العالية، مع تسريع بنسبة 1.81.81.8 مرة أثناء التدريب، وبنسبة 4.54.54.5 مرة أثناء الاستنتاج، وبنسبة تصل إلى 131313 مرة من حيث الكفاءة الحسابية في الوحدة المُفسِّرة.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
document-summarization-on-arxivDeepPyramidion
ROUGE-1: 47.15
document-summarization-on-arxiv-summarizationDeepPyramidion
Rouge-2: 19.99
text-summarization-on-arxivDeepPyramidion
ROUGE-1: 47.15
ROUGE-2: 19.99
text-summarization-on-arxivBlockwise(baseline)
ROUGE-1: 46.85
ROUGE-2: 19.39

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
تخفيف نماذج المُحَوِّل باستخدام تجميع تمثيل قابل للتدريب | الأوراق البحثية | HyperAI