HyperAIHyperAI

Command Palette

Search for a command to run...

تاكو: مجموعة بيانات حول المواضيع في توليد الشفرة الخوارزمية

Rongao Li Jie Fu Bo-Wen Zhang Tao Huang Zhihong Sun Chen Lyu Guang Liu Zhi Jin Ge Li

الملخص

نقدّم TACO، وهو مجموعة بيانات مفتوحة المصدر وذات حجم كبير مخصصة لتمثيل توليد الكود، مع التركيز على جوانب خوارزميات البرمجة، بهدف توفير مجموعة تدريب أكثر تحديًا ومحور تقييم في مجال نماذج توليد الكود. تضم TACO أسئلة برمجة بمستوى مسابقات حقيقية، وهي أكثر صعوبة، مما يعزز قدرة النماذج على فهم المشكلات والتفكير المنطقي في سياقات برمجة واقعية. تتضمن مجموعة التدريب 25,433 مشكلة برمجية، ومجموعة الاختبار 1,000 مشكلة، مع ما يصل إلى 1.55 مليون إجابة متنوعة ومختلفة. علاوة على ذلك، يحتوي كل مشكلة في TACO على عدة علامات دقيقة تشمل مواضيع المهمة، والخوارزميات المستخدمة، والمهارات البرمجية المطلوبة، ومستويات الصعوبة، مما يوفر مرجعًا دقيقًا لتدريب وتحليل نماذج توليد الكود. تُتاح مجموعة البيانات ونصوص التقييم على منصة Hugging Face Hub (https://huggingface.co/datasets/BAAI/TACO) وعلى GitHub (https://github.com/FlagOpen/TACO).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp