HyperAIHyperAI

Command Palette

Search for a command to run...

MuLD: معيار الوثائق الطويلة متعددة المهام

G Thomas Hudson Noura Al Moubayed

الملخص

التطور الملفت في تقنيات معالجة اللغة الطبيعية (NLP) قد تم دفعه من خلال تطوير مقاييس متعددة المهام مثل GLUE و SuperGLUE. بينما تركز هذه المقاييس على مهام تتضمن جملة واحدة أو اثنتين كمدخلات، فقد شهدنا أعمالًا مثيرة للاهتمام في تصميم تقنيات فعالة لمعالجة المدخلات الأطول بكثير. في هذا البحث، نقدم MuLD: مقاييس جديد للوثائق الطويلة يتكون فقط من وثائق تحتوي على أكثر من 10,000 رمز (token). عن طريق تعديل المهام الموجودة في معالجة اللغة الطبيعية، ننشئ مقاييس متنوع يطلب من النماذج أن تتمكن بنجاح من نمذجة الارتباطات طويلة الأمد في النص. نقيم أداء النماذج الحالية ونجد أن مقاييسنا أكثر تحديًا بكثير من نظيراتها التي تعتمد على الوثائق القصيرة. بالإضافة إلى ذلك، من خلال تقييم كل من المتحولات العادية والفعالة، نظهر أن النماذج ذات طول السياق المتزايد تكون أفضل في حل المهام المعروضة، مما يشير إلى أن التحسينات المستقبلية لهذه النماذج ضرورية لحل مشاكل الوثائق الطويلة المشابهة. نقوم بإصدار البيانات والكود للمعايير الأساسية لتشجيع المزيد من الأبحاث حول النماذج الفعالة لمعالجة اللغة الطبيعية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp