HyperAIHyperAI
منذ 2 أشهر

طريقة بسيطة للمنطق الشائع

Trieu H. Trinh; Quoc V. Le
طريقة بسيطة للمنطق الشائع
الملخص

الاستدلال الشائع هو تحدي قائم منذ فترة طويلة للتعلم العميق. على سبيل المثال، من الصعب استخدام الشبكات العصبية لمعالجة مجموعة بيانات Winograd Schema (Levesque等人,2011). في هذا البحث، نقدم طريقة بسيطة للاستدلال الشائع باستخدام الشبكات العصبية، معتمدين على التعلم غير المشرف. جوهر طرقنا يكمن في استخدام نماذج اللغة، التي تم تدريبها على كميات ضخمة من البيانات غير المصنفة، لتقييم الأسئلة المتعددة الخيارات التي تطرحها اختبارات الاستدلال الشائع. في كل من تحديي توضيح الضمائر وWinograd Schema، تتفوق نماذجنا بشكل كبير على الطرق السابقة الأكثر تقدماً دون الحاجة إلى استخدام قواعد بيانات معرفية مكلفة أو خصائص مهندسة يدوياً. نقوم بتدريب مجموعة كبيرة من نماذج اللغة ذات الارتباط العصبي التكراري (RNN) التي تعمل على مستوى الكلمات أو الحروف باستخدام LM-1-Billion، CommonCrawl، SQuAD، كتب Gutenberg، وملف تعريف خاص لهذا المهمة ونظهر أن تنوع البيانات التدريبية يلعب دورًا مهمًا في أداء الاختبار. كما تشير التحليلات الإضافية إلى أن نظامنا يكتشف بنجاح الخصائص الأساسية للسياق التي تحدد الإجابة الصحيحة، مما يدل على فهم جيد للمعرفة الشائعة.注:在阿拉伯语中,“Levesque等人”通常会翻译为“Levesque et al.”,以保持国际学术文献引用的习惯。

طريقة بسيطة للمنطق الشائع | أحدث الأوراق البحثية | HyperAI