HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الكتب المدرسية متعددة الوسائط - 6.5 مليون

Discuss on Discord

Date

منذ 6 أشهر

Organization

Paper URL

arxiv.org

هذه المجموعة من البيانات هي مجموعة بيانات كتب مدرسية متعددة الوسائط أصدرتها أكاديمية علي بابا دامو في عام 2025. نتائج الورقة ذات الصلة هي:2.5 سنة في الفصل الدراسي: كتاب مدرسي متعدد الوسائط للتدريب المسبق على الرؤية واللغة"، والذي يهدف إلى تعزيز التدريب المسبق متعدد الوسائط وتوسيع قدرة النموذج على التعامل مع المدخلات البصرية والنصية المتداخلة.

تحتوي مجموعة البيانات على 6.5 مليون صورة و800 مليون نص من فيديوهات تعليمية. جميع الصور والنصوص مُستخرجة من فيديوهات تعليمية عبر الإنترنت (22,000 ساعة دراسية)، تغطي ستة مواد أساسية، مثل الرياضيات والفيزياء والكيمياء، مما يوفر خلفية أكثر تماسكًا ومعرفة أغنى لمواءمة الصور والنصوص.

مثال على بناء مجموعة بيانات من فيديو تعليمي

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp