HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات مهام الاستدلال Stratos 17k المصممة خصيصًا

التاريخ

منذ 9 أشهر

الحجم

107.46 MB

المؤسسة

رابط الورقة البحثية

www.bespokelabs.ai

*تدعم مجموعة البيانات هذه الاستخدام عبر الإنترنت.انقر هنا للقفز.

Bespoke-Stratos-17k هي مجموعة بيانات عالية الجودة مصممة لمهام الاستدلال، طورها فريق Bespoke Labs في عام 2025. المدونة ذات الصلة هي "بيسبوك-ستراتوس: الفعالية غير المعقولة لتقطير المنطقتم إنشاء مجموعة البيانات هذه من خلال تحسين خط أنابيب بيانات Sky-T1 من Berkeley واستخدام البيانات المُنقّاة من DeepSeek-R1، وهي مصممة لدعم تدريب نماذج الاستدلال عالية الأداء. تحتوي مجموعة البيانات على أسئلة، وتتبعات استدلال، وإجابات، تغطي مجالات متنوعة مثل البرمجة، والرياضيات، والألغاز العلمية. باستخدام أداة Bespoke Curator، يمكن إنشاء مجموعة بيانات استدلال عالية الجودة في غضون ساعة ونصف فقط، بتكلفة حوالي 800 دولار أمريكي. تستخدم مجموعة البيانات هذه DeepSeek-R1 كنموذج استدلال للمعلم، مما يُبسط عملية إنشاء البيانات دون الحاجة إلى خطوات تنسيق إضافية. بالإضافة إلى ذلك، أدى تصفية الحلول الرياضية غير الصحيحة باستخدام gpt-4o-mini إلى تحسين كبير في معدل الاحتفاظ بالحلول الرياضية الصحيحة من 25% إلى 73%.

تتكون مجموعة البيانات من 3 أجزاء: بيانات البرمجة (5000 بيانات من APPs وTACO)، وبيانات الرياضيات (10000 بيانات من مجموعات AIME وMATH وOlympiads من مجموعة بيانات NuminaMATH)، وبيانات العلوم والألغاز (1000 بيانات من STILL-2). تم استخدام هذه البيانات لتدريب نموذجين للاستدلال، Bespoke-Stratos-32B وBespoke-Stratos-7B، واللذين حققا أداءً جيدًا في معايير الرياضيات والتفكير البرمجي، متفوقين على النماذج السابقة.

Bespoke-Stratos-17k.torrent
البذر 1التنزيل 0مكتمل 133إجمالي التنزيلات 237
  • Bespoke-Stratos-17k/
    • README.md
      2.05 KB
    • README.txt
      4.09 KB
      • data/
        • Bespoke-Stratos-17k.zip
          107.46 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مجموعة بيانات مهام الاستدلال Stratos 17k المصممة خصيصًا | مجموعات البيانات | HyperAI