HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الكتب المدرسية متعددة الوسائط - 6.5 مليون

ناقش على Discord

التاريخ

منذ 7 أشهر

المؤسسة

مجموعة علي بابا

رابط الورقة البحثية

arxiv.org

هذه المجموعة من البيانات هي مجموعة بيانات كتب مدرسية متعددة الوسائط أصدرتها أكاديمية علي بابا دامو في عام 2025. نتائج الورقة ذات الصلة هي:2.5 سنة في الفصل الدراسي: كتاب مدرسي متعدد الوسائط للتدريب المسبق على الرؤية واللغة"، والذي يهدف إلى تعزيز التدريب المسبق متعدد الوسائط وتوسيع قدرة النموذج على التعامل مع المدخلات البصرية والنصية المتداخلة.

تحتوي مجموعة البيانات على 6.5 مليون صورة و800 مليون نص من فيديوهات تعليمية. جميع الصور والنصوص مُستخرجة من فيديوهات تعليمية عبر الإنترنت (22,000 ساعة دراسية)، تغطي ستة مواد أساسية، مثل الرياضيات والفيزياء والكيمياء، مما يوفر خلفية أكثر تماسكًا ومعرفة أغنى لمواءمة الصور والنصوص.

مثال على بناء مجموعة بيانات من فيديو تعليمي

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp