HyperAIHyperAI

Command Palette

Search for a command to run...

الكتب المدرسية هي كل ما تحتاجه II: تقرير فني حول phi-1.5

Yuanzhi Li Sébastien Bubeck Ronen Eldan Allie Del Giorno Suriya Gunasekar Yin Tat Lee

الملخص

نواصل البحث في قوة النماذج اللغوية القائمة على التحولات (Transformers) الأصغر حجمًا، كما بدأته \textbf{TinyStories} -- وهي نموذج يحتوي على 10 ملايين معلمة يمكنه إنتاج نصوص متماسكة باللغة الإنجليزية -- والعمل اللاحق على \textbf{phi-1}، وهو نموذج يحتوي على 1.3 مليار معلمة ويتميز بأداء قريب من الأفضل في مجال برمجة لغة Python. اقترح العمل الأخير استخدام النماذج اللغوية الكبيرة الحالية (LLMs) لإنشاء بيانات بـجودة الكتب المدرسية'' كطريقة لتعزيز عملية التعلم مقارنة بالبيانات التقليدية من الإنترنت. نتبع نهجالكتب المدرسية هي كل ما تحتاجه''، مع التركيز هذه المرة على الاستدلال العقلاني الشائع في اللغة الطبيعية، ونقوم بإنشاء نموذج جديد يحتوي على 1.3 مليار معلمة باسم \textbf{phi-1.5}، والذي يتميز بأداء في المهام اللغوية الطبيعية مشابه لأداء النماذج التي تبلغ حجمها خمسة أضعاف حجمه، ويفوق معظم النماذج اللغوية غير الرائدة (LLMs) في المهام الاستدلالية الأكثر تعقيدًا مثل الرياضيات الابتدائية والبرمجة الأساسية. بشكل عام، يظهر \textbf{phi-1.5} العديد من الصفات التي تميز النماذج اللغوية الكبيرة جدًا، سواء كانت إيجابية -- مثل القدرة على ``التفكير خطوة بخطوة'' أو أداء بعض التعلم السياقي الأولي -- أو سلبية، بما في ذلك الوهم والتوليد المحتمل للنصوص السامة والمتحيزة -- ومع ذلك، فإننا نلاحظ تحسنًا في هذا الجانب بفضل عدم وجود بيانات من الإنترنت. نقوم بتوفير مصدر \textbf{phi-1.5} كودًا مفتوحًا لتشجيع المزيد من الأبحاث حول هذه المواضيع الملحة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
الكتب المدرسية هي كل ما تحتاجه II: تقرير فني حول phi-1.5 | مستندات | HyperAI