Command Palette
Search for a command to run...
استعلام عن نطاقات حرفية، شرط الاستعلام، استخراج الأدلة، مجموعة البيانات
التاريخ
رابط الورقة البحثية
الترخيص
Apache 2.0
Verbatim Spans هي مجموعة بيانات لاستخلاص الأدلة الشرطية متعددة المجالات، تم إصدارها في أبريل 2026 من قبل جامعة فيينا التقنية بالتعاون مع مختبرات KRLabs. وفيما يلي ورقة البحث ذات الصلة: ACL-Verbatim: الإجابة على الأسئلة لأغراض البحث دون استخدام الهلوسةالهدف هو بناء معيار عام لتدريب نماذج استخراج الأدلة المتعلقة بشروط الاستعلام، والتي يمكن استخدامها على نطاق واسع في توليد تعزيز الاسترجاع (RAG) ومهام الإجابة على الأسئلة الاستخراجية. تحتوي مجموعة البيانات هذه على 174383 صفًا من بيانات التدريب و20174 صفًا من بيانات التحقق، وتغطي ثلاثة أنواع رئيسية من المجموعات: أوراق معالجة اللغة الطبيعية، والإجابة على الأسئلة متعددة المجالات، ومخرجات التعليمات البرمجية والأدوات، والتي تتوافق مع مهام شرح الأدلة على مستوى الفقرة، ومستوى الجملة، ومستوى كتلة التعليمات البرمجية، على التوالي.
مصدر البيانات
- قاعدة بيانات ACL الفضية: تغطي أوراق البحث في مجال معالجة اللغات الطبيعية، باستخدام معايير الشرح على مستوى الفقرات. بعد التنظيف والتصفية، تحتوي على 20916 نقطة بيانات تدريبية و2319 نقطة بيانات للتحقق، وهو ما يمثل جزءًا فقط من مجموعة البيانات الأصلية.
- RAGBench: يغطي هذا النظام مجالات التمويل والرعاية الصحية والقانون والإجابة على الأسئلة بشكل عام، ويستخدم معايير تصنيف على مستوى الجملة، بالإضافة إلى نسخة متوازنة من العينة مع قيود على الحد الأقصى. تتكون مجموعة البيانات النهائية من 101,550 نقطة بيانات تدريبية و15,276 نقطة بيانات للتحقق.
- Squeez: يغطي كلاً من التعليمات البرمجية ومخرجات أداة SWE-bench، باستخدام مواصفات شرح نطاق كتلة/سطر التعليمات البرمجية، ويستخرج البيانات المنظمة باستخدام 51917 سطرًا من بيانات التدريب و2579 سطرًا من بيانات التحقق.
الاستشهاد
@misc{Recski:2026,
title={ACL-Verbatim: hallucination-free question answering for research},
author={Gábor Recski and Szilveszter Tóth and Nadia Verdha and István Boros and Ádám Kovács},
year={2026},
eprint={2605.21102},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2605.21102},
}
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.