HyperAIHyperAI

Command Palette

Search for a command to run...

هل اثنان أفضل من الكثير؟ التصنيف الثنائي كأداة فعالة للإجابة على الأسئلة ذات الخيارات المتعددة

Deepanway Ghosal; Navonil Majumder; Rada Mihalcea; Soujanya Poria

الملخص

نقترح إعادة تصميم بسيطة للمهام الإجابة على الأسئلة ذات الخيارات المتعددة (MCQA) كسلسلة من التصنيفات الثنائية. يتم تنفيذ مهمة MCQA عادةً عن طريق تقييم كل زوج (سؤال، إجابة) مُعَدَّلًا على جميع الأزواج، ثم اختيار الإجابة من الزوج الذي يحقق أعلى درجة. بالنسبة لـ n خيارات إجابة، هذا يعادل نظام تصنيف ذو n فئات حيث تكون فئة واحدة فقط (الإجابة الصحيحة) صحيحة. بدلاً من ذلك، نوضح أن تصنيف (السؤال، الإجابة الصحيحة) كحالات إيجابية و(السؤال، الإجابة الخاطئة) كحالات سلبية هو أكثر فعالية بكثير عبر مختلف النماذج والقواعد البيانات. نظهر فعالية النهج المقترح في مهام مختلفة -- الاستدلال الاستدلالي (Abductive Reasoning)، الإجابة على الأسئلة المتعلقة بالفطنة الشائعة (Commonsense Question Answering)، الإجابة على الأسئلة العلمية (Science Question Answering)، وإكمال الجمل (Sentence Completion). يحقق نموذج DeBERTa للتصنيف الثنائي لدينا أفضل الأداء أو قريبًا منه في لوحات المتصدرين العامة لهذه المهام. يمكن الوصول إلى شفرة المصدر للنهج المقترح على الرابط: https://github.com/declare-lab/TEAM.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp