HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الكتب المدرسية متعددة الوسائط - 6.5 مليون

التاريخ

منذ 4 أشهر

المؤسسة

رابط الورقة البحثية

arxiv.org

انضم إلى مجتمع Discord

هذه المجموعة من البيانات هي مجموعة بيانات كتب مدرسية متعددة الوسائط أصدرتها أكاديمية علي بابا دامو في عام 2025. نتائج الورقة ذات الصلة هي:2.5 سنة في الفصل الدراسي: كتاب مدرسي متعدد الوسائط للتدريب المسبق على الرؤية واللغة"، والذي يهدف إلى تعزيز التدريب المسبق متعدد الوسائط وتوسيع قدرة النموذج على التعامل مع المدخلات البصرية والنصية المتداخلة.

تحتوي مجموعة البيانات على 6.5 مليون صورة و800 مليون نص من فيديوهات تعليمية. جميع الصور والنصوص مُستخرجة من فيديوهات تعليمية عبر الإنترنت (22,000 ساعة دراسية)، تغطي ستة مواد أساسية، مثل الرياضيات والفيزياء والكيمياء، مما يوفر خلفية أكثر تماسكًا ومعرفة أغنى لمواءمة الصور والنصوص.

مثال على بناء مجموعة بيانات من فيديو تعليمي

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp