HyperAIHyperAI
منذ 11 أيام

TabSQLify: تحسين قدرات الاستدلال الخاصة بـ LLMs من خلال تحليل الجداول

Md Mahadi Hasan Nahid, Davood Rafiei
TabSQLify: تحسين قدرات الاستدلال الخاصة بـ LLMs من خلال تحليل الجداول
الملخص

الاستدلال على الجداول هو مهمة صعبة تتطلب فهمًا لكل من الأسئلة باللغة الطبيعية والبيانات الجدولية المنظمة. وقد أظهرت النماذج اللغوية الكبيرة (LLMs) قدرات مذهلة في فهم وإنتاج اللغة الطبيعية، لكنها غالبًا ما تواجه صعوبات في التعامل مع الجداول الكبيرة بسبب حدود طول المدخلات. في هذه الورقة، نقترح طريقة جديدة تُدعى TabSQLify، والتي تستخدم توليد SQL من النص لتفكيك الجداول إلى جداول فرعية أصغر وأكثر صلة، تحتوي فقط على المعلومات الأساسية الضرورية للإجابة على الأسئلة أو التحقق من العبارات، قبل إجراء عملية الاستدلال. في تقييمنا الشامل على أربع مجموعات بيانات صعبة، تُظهر طريقة我们的 أداءً مماثلاً أو أفضل من الطرق السائدة التي تعتمد على استخدام الجداول الكاملة كمدخلات. علاوةً على ذلك، يمكن لطريقة我们的 تقليل طول السياق المدخل بشكل كبير، مما يجعلها أكثر قابلية للتوسع وكفاءة في تطبيقات الاستدلال على الجداول على نطاق واسع. وتفوق طريقة我们的 بشكل ملحوظ في معيار WikiTQ، حيث حققت دقة قدرها 64.7٪. كما حققت طريقة我们的 دقة عالية قدرها 79.5٪ في معيار TabFact، ما يفوق النماذج الأساسية القائمة على LLM مثل gpt-3.5-turbo (ChatGPT). وتُقلل طريقة TabSQLify حجم الجدول بشكل كبير، مما يخفف من الحمل الحسابي على النماذج اللغوية الكبيرة عند التعامل مع الجداول الكبيرة دون التضحية بالأداء.

TabSQLify: تحسين قدرات الاستدلال الخاصة بـ LLMs من خلال تحليل الجداول | أحدث الأوراق البحثية | HyperAI