HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات مضغوطة في ذاكرة سياق OpenMementos

التاريخ

منذ 19 ساعات

المؤسسة

Microsoft

الترخيص

MIT

OpenMementos هي مجموعة بيانات لضغط السياق والذاكرة، أصدرتها مايكروسوفت عام 2026، وهي مصممة لنمذجة الاستدلال طويل السلسلة وقدرات إدارة السياق للنماذج الكبيرة. تهدف هذه المجموعة إلى تدريب النماذج على ضغط السياق والاستدلال المستمر، مما يدعم مهام الاستدلال المعقدة متعددة الخطوات ضمن نطاق سياق محدود. وهي قابلة للتطبيق على نطاق واسع في سيناريوهات بحثية مثل نمذجة الاستدلال طويل السلسلة، وتدريب النماذج المحسّنة بالذاكرة، والتوليد الفعال. تستند هذه المجموعة من البيانات إلى مجموعة بيانات الاستدلال OpenThoughts، وتحتوي على 228,557 مسار استدلال منظم، منها 123,333 مسارًا في الرياضيات، و61,485 مسارًا في العلوم، و43,739 مسارًا في البرمجة. ويبلغ متوسط عدد الجمل في كل مسار 187 جملة.

بنية البيانات

توفر هذه المجموعة من البيانات مجموعتين فرعيتين: الوضع الافتراضي: يستخدم للتدريب والضبط الدقيق الخاضع للإشراف (SFT).

  • problem(string): بيان المشكلة (المدخلات)
  • الاستجابة (سلسلة نصية): استجابة استدلالية بتنسيق Memento تحتوي على علامات الكتلة/الملخص.
  • المجال (سلسلة نصية): المجال الذي تنتمي إليه البيانات (على سبيل المثال، البرمجة، الرياضيات، العلوم).
  • المصدر (نص): المصدر الأصلي للبيانات (من OpenThoughts-v3)
  • مستوى الصعوبة (عدد صحيح): مستوى صعوبة المسألة كامل: يُستخدم للبحث المتعمق أو المعالجة الآلية بالإضافة إلى الحقول المذكورة أعلاه، يحتوي أيضاً على معلومات تفصيلية حول خطوات المعالجة الوسيطة:
  • sentences(list[string]): قائمة من الجمل المستمدة من الاستجابة، وتستخدم للنمذجة والتحليل الدقيقين.
  • blocks(list[list[int]]): مؤشرات حدود كتل الاستدلال، كل عنصر منها عبارة عن [start_idx, end_idx]، ويمثل نطاق الجملة المقابل لهذه الكتلة.
  • block_summaries(list[string]): ملخص لمراحل كل كتلة، يعكس عملية التفكير في الضغط التدريجي والتجريد.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp