HyperAIHyperAI

Command Palette

Search for a command to run...

XCOPA: مجموعة بيانات متعددة اللغات للاستدلال العقلي السببي

Edoardo Maria Ponti Goran Glavaš Olga Majewska Qianchu Liu Ivan Vulić Anna Korhonen

الملخص

لمحاكاة قدرة الإنسان على اللغة، يجب أن تكون أنظمة معالجة اللغة الطبيعية قادرة على التفكير في ديناميكيات المواقف اليومية، بما في ذلك الأسباب والنتائج المحتملة لها. علاوةً على ذلك، ينبغي أن تكون قادرة على تعميم المعرفة العالمية المكتسبة إلى لغات جديدة، مع مراعاة الفروقات الثقافية. يعتمد التقدم في التفكير الآلي ونقل اللغة عبر اللغات على توفر معايير تقييم صعبة ومحفزة. مستلهمين من هاتين الحاجتين، نقدّم XCOPA، وهي مجموعة بيانات متعددة اللغات متنوعة من الناحية الطبوغرافية للتفكير المشترك السببي بلغات 11 لغة، بما في ذلك لغات محدودة الموارد مثل الكيتشوا الشرقية في أبوريماك وهايتيان الكريول. قمنا بتقييم مجموعة من النماذج الرائدة في هذا المجال على هذه المجموعة الجديدة من البيانات، وتبين أن أداء الطرق الحالية القائمة على التدريب المسبق متعدد اللغات والضبط الصفرية (zero-shot fine-tuning) يُظهر أداءً أقل مقارنةً بأسلوب نقل الترجمة. وأخيرًا، نقترح استراتيجيات لتعديل النماذج متعددة اللغات لتناسب لغات غير مُدرَّجة في العينة (out-of-sample) ذات الموارد المحدودة، حيث تتوفر فقط مجموعة نصية صغيرة أو قاموس ثنائي اللغة، ونُسجّل تحسينات كبيرة مقارنةً بالقاعدة العشوائية. تُتاح مجموعة بيانات XCOPA مجانًا على موقع github.com/cambridgeltl/xcopa.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp