Command Palette
Search for a command to run...
مجموعة البيانات الرياضية Proof-Pile-2

Proof-Pile-2 عبارة عن مجموعة بيانات مميزة مكونة من 55 مليار مستند رياضي وعلمي. مزيج من الأوراق العلمية ومحتوى الويب المتعلق بالرياضيات وأكواد الرياضيات حتى أبريل 2023 (باستثناء مجموعة فرعية محددة من خطوات Lean proof). تم إنشاء مجموعة البيانات هذه لتدريب نموذجي Llemma 7B وLlemma 34B.
وهو يتألف من ثلاث مجموعات فرعية:
arxiv(29 مليار رمز): مجموعة فرعية من ArXiv تابعة لـ RedPajamaopen-web-math(15 مليار رمز):أوبن ويب ماث مجموعة بيانات تحتوي على العديد من النصوص الرياضية عالية الجودة من الإنترنت.algebraic-stack(11 مليار رمز): مجموعة بيانات جديدة من الرموز الرياضية التي تغطي الحوسبة العددية، والجبر الحاسوبي، والرياضيات الرسمية.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.