منذ 7 أشهر

الملخص

الاستدلال الشائع هو تحدي قائم منذ فترة طويلة للتعلم العميق. على سبيل المثال، من الصعب استخدام الشبكات العصبية لمعالجة مجموعة بيانات Winograd Schema (Levesque等人，2011). في هذا البحث، نقدم طريقة بسيطة للاستدلال الشائع باستخدام الشبكات العصبية، معتمدين على التعلم غير المشرف. جوهر طرقنا يكمن في استخدام نماذج اللغة، التي تم تدريبها على كميات ضخمة من البيانات غير المصنفة، لتقييم الأسئلة المتعددة الخيارات التي تطرحها اختبارات الاستدلال الشائع. في كل من تحديي توضيح الضمائر وWinograd Schema، تتفوق نماذجنا بشكل كبير على الطرق السابقة الأكثر تقدماً دون الحاجة إلى استخدام قواعد بيانات معرفية مكلفة أو خصائص مهندسة يدوياً. نقوم بتدريب مجموعة كبيرة من نماذج اللغة ذات الارتباط العصبي التكراري (RNN) التي تعمل على مستوى الكلمات أو الحروف باستخدام LM-1-Billion، CommonCrawl، SQuAD، كتب Gutenberg، وملف تعريف خاص لهذا المهمة ونظهر أن تنوع البيانات التدريبية يلعب دورًا مهمًا في أداء الاختبار. كما تشير التحليلات الإضافية إلى أن نظامنا يكتشف بنجاح الخصائص الأساسية للسياق التي تحدد الإجابة الصحيحة، مما يدل على فهم جيد للمعرفة الشائعة.注：在阿拉伯语中，“Levesque等人”通常会翻译为“Levesque et al.”，以保持国际学术文献引用的习惯。

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار