HyperAIHyperAI
منذ 2 أشهر

النماذج اللغوية الكبيرة هي مفككات متعددة الاستخدامات: تفكيك الأدلة والأسئلة للمنطق القائم على الجداول

Yunhu Ye; Binyuan Hui; Min Yang; Binhua Li; Fei Huang; Yongbin Li
النماذج اللغوية الكبيرة هي مفككات متعددة الاستخدامات: تفكيك الأدلة والأسئلة للمنطق القائم على الجداول
الملخص

أظهر التفكير القائم على الجداول تقدماً ملحوظاً في الجمع بين النماذج العميقة والتفكير المنفصل، والذي يتطلب التفكير في أسئلة اللغة الطبيعية (NL) الحرة والبيانات الجدولية المهيكلة. ومع ذلك، غالباً ما تعاني حلول التفكير القائمة على الجداول السابقة من تدهور كبير في الأداء عند التعامل مع أدلة ضخمة (الجداول). بالإضافة إلى ذلك، تجد معظم الطرق الموجودة صعوبة في التفكير حول الأسئلة المعقدة نظراً لتوزع المعلومات المطلوبة في أماكن مختلفة. لحل هذه التحديات، نستغل النماذج اللغوية الكبيرة (LLMs) كمفككات للتفكير الفعال القائم على الجداول، حيث تقوم هذه النماذج (أولاً) بتفكيك الأدلة الضخمة (جدول ضخم) إلى أدلة فرعية (جدول صغير) لتقليل تأثير المعلومات غير الضرورية في التفكير الجدولي؛ و(ثانياً) بتفكيك الأسئلة المعقدة إلى أسئلة فرعية أبسط للتفكير النصي. تحديداً، نستخدم أولاً النماذج اللغوية الكبيرة لتفكيك الأدلة (الجداول) المرتبطة بالسؤال الحالي، مع الاحتفاظ بالأدلة ذات الصلة واستبعاد الأدلة غير ذات الصلة المتبقية من الجدول الضخم. علاوة على ذلك، نقترح استراتيجية "تحليل-تنفيذ-تعبئة" لتخفيف مشكلة الوهم في سلسلة الفكر من خلال فصل المنطق والحسابات العددية في كل خطوة. أظهرت التجارب الواسعة أن طريقتنا قادرة على الاستفادة بشكل فعال من الأدلة والأسئلة المفككة وتتفوق على الأساليب الأساسية القوية في مجموعات البيانات TabFact وWikiTableQuestions وFetaQA. يُذكر أن نموذجنا قد تفوق لأول مرة على الأداء البشري في مجموعة بيانات TabFact.

النماذج اللغوية الكبيرة هي مفككات متعددة الاستخدامات: تفكيك الأدلة والأسئلة للمنطق القائم على الجداول | أحدث الأوراق البحثية | HyperAI