HyperAIHyperAI

Command Palette

Search for a command to run...

التوليد المعزز للبيانات للاستدلال بالفطنة المشتركة

Yiben Yang ♦ Chaitanya Malaviya †Ⅱ Jared Fernandez ♦ Swabha Swayamdipta † Ronan Le Bras † Ji-Ping Wang ♦ Chandra Bhagavatula † Yejin Choi †◇ Doug Downey ♦†

الملخص

التطورات الحديثة في الاستدلال الشائع تعتمد على بيانات تدريب مُشَاهَدَة بشرية على نطاق واسع لتحقيق أفضل الأداء. ومع ذلك، فإن إعداد البيانات التدريبية يدوياً هو أمر مكلف وقد ثبت أنه يُدخِل عيوب في التسميات التي يمكن للنماذج العصبية استغلالها والتكيف الزائد عليها. نقوم بدراسة G-DAUG^C، وهي طريقة جديدة لتوسيع البيانات التوليدية تهدف إلى تحقيق تعلم أكثر دقة ومتانة في البيئات ذات الموارد المحدودة. نهجنا يقوم بتوليد أمثلة اصطناعية باستخدام نماذج اللغة المسبقة التدريب، ويختار مجموعة من الأمثلة الأكثر إفادة وتعدداً لتوسيع البيانات. في التجارب التي أجريت باستخدام عدة مقاييس للاستدلال الشائع، حقق G-DAUG^C تفوقاً ثابتاً على الطرق الحالية لتوسيع البيانات المستندة إلى الترجمة العكسية، وأقام سجلًا جديدًا لأفضل الأداء على WinoGrande (وينوغراند)، CODAH (كوادا)، وCommonsenseQA (كومنسنس كيو أيه). بالإضافة إلى ذلك، فإن التدريب المعزز بواسطة G-DAUG^C يحسن أيضاً التعميم خارج نطاق التوزيع، مما يظهر متانة أكبر ضد الأمثلة المعادية أو المشوهة. تُبيِّن تحليلاتنا أن G-DAUG^C ينتج مجموعة متنوعة من الأمثلة التدريبية السليمة، وأن أساليبه في الاختيار والتدريب مهمة للأداء. تشجع نتائجنا البحث المستقبلي نحو توسيع البيانات التوليدي لتعزيز كلٍ من التعلم داخل نطاق التوزيع والتعميم خارجه.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp