Command Palette
Search for a command to run...
مجموعة بيانات الكتب المدرسية متعددة الوسائط - 6.5 مليون
هذه المجموعة من البيانات هي مجموعة بيانات كتب مدرسية متعددة الوسائط أصدرتها أكاديمية علي بابا دامو في عام 2025. نتائج الورقة ذات الصلة هي:2.5 سنة في الفصل الدراسي: كتاب مدرسي متعدد الوسائط للتدريب المسبق على الرؤية واللغة"، والذي يهدف إلى تعزيز التدريب المسبق متعدد الوسائط وتوسيع قدرة النموذج على التعامل مع المدخلات البصرية والنصية المتداخلة.
تحتوي مجموعة البيانات على 6.5 مليون صورة و800 مليون نص من فيديوهات تعليمية. جميع الصور والنصوص مُستخرجة من فيديوهات تعليمية عبر الإنترنت (22,000 ساعة دراسية)، تغطي ستة مواد أساسية، مثل الرياضيات والفيزياء والكيمياء، مما يوفر خلفية أكثر تماسكًا ومعرفة أغنى لمواءمة الصور والنصوص.

مثال على بناء مجموعة بيانات من فيديو تعليمي
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.