HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات LongBlocks للإجابة على الأسئلة متعددة اللغات ذات السياق الطويل

التاريخ

منذ شهر واحد

الترخيص

CC BY-SA 4.0

LongBlocks هي مجموعة بيانات تركيبية متعددة اللغات ذات سياق طويل تم إصدارها في عام 2026 من قبل جامعة لشبونة، ومعهد الاتصالات، وTransPerfect، ومؤسسات أخرى. تحتوي مجموعة البيانات هذه على ما يقرب من 194000 مثال على أسئلة وأجوبة ذات سياق طويل، تغطي مجموعات وثائق طويلة مثل الكتب ونصوص صفحات الويب وويكيبيديا وأوراق arXiv ورموز البرمجة وأسئلة وأجوبة المجتمع.

حقول البيانات:

  • id: سلسلة نصية، معرف مثيل فريد (يستخدم فقط لاستعادة بيانات الكتب المقيدة؛ null للمصادر الأخرى).
  • المستند: سلسلة نصية، محتوى مستند المصدر الطويل (قيمة فارغة لبيانات الكتاب المحدودة).
  • المصدر: سلسلة نصية، اسم مجموعة النصوص المصدرية.
  • اللغة: سلسلة نصية تمثل لغة أو لغة البرمجة المستخدمة في المثال.
  • السؤال: تركيب السلاسل النصية، مشكلة السياق الطويل.
  • الإجابة: سلسلة نصية، إجابة مرجعية تم فحصها للتأكد من صحتها.
  • response_Qwen3-Next-80B-A3B / response_Qwen3.5-27B / response_Nemotron-3-Nano-30B-A3B: سلاسل نصية تتوافق مع الاستجابات التي تم إنشاؤها بواسطة نموذج المعلم.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp