منذ 8 أشهر

الملخص

التحقق من الحقائق قد جذب الكثير من الاهتمام البحثي مؤخرًا، على سبيل المثال في مجال الصحافة والتسويق وصنع السياسات، حيث يمكن أن تؤثر المعلومات الخاطئة والمضللة عبر الإنترنت على آراء الأشخاص وأفعالهم. رغم أن التحقق من الحقائق يعتبر مهمة صعبة بشكل عام، إلا أنه في العديد من الحالات يمكن كشف الزيف بسهولة بناءً على تحليل الجداول التي تحتوي على معلومات موثوقة. لذلك، ظهر التحقق من الحقائق القائم على الجداول مؤخرًا كمجال بحثي مهم ومتنامي. ومع ذلك، كان التقدم محدودًا بسبب نقص قواعد البيانات التي يمكن استخدامها لتدريب النماذج اللغوية (LMs) مسبقًا لتكون على دراية بالعمليات الجدولية الشائعة مثل تجميع العمود أو مقارنة الأزواج. لسد هذه الفجوة، نقدم في هذا البحث إطار عمل جديد يُسمى PASTA، وهو إطار رائد للتحقق من الحقائق القائم على الجداول من خلال التدريب المسبق باستخدام أسئلة الملء الفارغة المصنعة بين الجمل والجداول. وبشكل خاص، صممنا ستة أنواع شائعة من مهام الملء الفارغة بين الجمل والجداول، وهي: التصفية (Filter)، والتجميع (Aggregation)، والأعلى قيمة (Superlative)، والمقارنة (Comparative)، والترتيب (Ordinal)، والفردي (Unique). استنادًا إلى هذه المهام، أنتجنا مجموعة كبيرة تتكون من 1.2 مليون زوج جملة-جدول مستخلصة من WikiTables. يستخدم PASTA نموذج لغوي تم تدريبه مسبقًا حديثًا وهو DeBERTaV3 ويقوم بتدريبه أكثر على قاعدة بياناتنا. تظهر نتائج التجارب الخاصة بنا أن PASTA حقق أداءً رائدًا جديدًا في معياري التحقق من الحقائق القائمين على الجداول: TabFact و SEM-TAB-FACTS. وبشكل خاص، في مجموعة TabFact المعقدة التي تحتوي على عمليات متعددة، يتفوق PASTA بشكل كبير على الحالة الرائدة السابقة بمقدار 4.7 نقطة (85.6٪ مقابل 80.9٪)، وتضيق الفجوة بين أداء PASTA والأداء البشري في مجموعة الاختبار الصغيرة لـ TabFact إلى مجرد 1.5 نقطة (90.6٪ مقابل 92.1٪).

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Zihui Gu; Ju Fan; Nan Tang; Preslav Nakov; Xiaoman Zhao; Xiaoyong Du

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Zihui Gu; Ju Fan; Nan Tang; Preslav Nakov; Xiaoman Zhao; Xiaoyong Du

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Zihui Gu; Ju Fan; Nan Tang; Preslav Nakov; Xiaoman Zhao; Xiaoyong Du

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

PASTA: التحقق من الحقائق مع الوعي بعمليات الجداول من خلال التدريب المسبق على جملة-جدول مكملة

Zihui Gu; Ju Fan; Nan Tang; Preslav Nakov; Xiaoman Zhao; Xiaoyong Du

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

PASTA: التحقق من الحقائق مع الوعي بعمليات الجداول من خلال التدريب المسبق على جملة-جدول مكملة

Zihui Gu; Ju Fan; Nan Tang; Preslav Nakov; Xiaoman Zhao; Xiaoyong Du

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

PASTA: التحقق من الحقائق مع الوعي بعمليات الجداول من خلال التدريب المسبق على جملة-جدول مكملة

Zihui Gu; Ju Fan; Nan Tang; Preslav Nakov; Xiaoman Zhao; Xiaoyong Du

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters