Command Palette
Search for a command to run...
مجموعة بيانات التحسين الدقيقة لنموذج LongCite-45k الكبير
التاريخ
الحجم
رابط النشر
رابط الورقة البحثية
العلامات
LongCite-45k هي مجموعة بيانات مفتوحة المصدر أطلقتها جامعة تسينغهوا في عام 2024. وتهدف إلى تحسين مصداقية وإمكانية التحقق من نماذج اللغة الكبيرة (LLMs) في مهام الإجابة على الأسئلة النصية الطويلة. نتائج الورقة ذات الصلة هيLongCite: تمكين طلاب الماجستير في القانون من إنشاء استشهادات دقيقة في سياق ضمان الجودة الطويل".
تحتوي مجموعة البيانات على 44600 من بيانات الإجابة على الأسئلة عالية الجودة مع الاستشهادات على مستوى الجملة، وتدعم معالجة النصوص الطويلة بحد أقصى يبلغ 128 ألف رمز، وتمكن المستخدمين من التحقق من دقة إجابات النموذج من خلال إنشاء استشهادات دقيقة على مستوى الجملة.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.