Command Palette
Search for a command to run...
مجموعة بيانات الإجابة على الأسئلة الاصطناعية متعددة الوسائط CoSyn-400K
التاريخ
الحجم
رابط الورقة البحثية
CoSyn-400K عبارة عن مجموعة بيانات متعددة الوسائط للإجابة على الأسئلة الاصطناعية تم إصدارها بشكل مشترك من قبل جامعة بنسلفانيا ومعهد ألين للذكاء الاصطناعي في عام 2025.توسيع نطاق فهم الصور الغنية بالنصوص من خلال توليد البيانات المتعددة الوسائط الاصطناعية الموجهة بالكود"، والذي يهدف إلى توفير موارد بيانات تركيبية عالية الجودة وقابلة للتطوير لتدريب النموذج المتعدد الوسائط.
تحتوي مجموعة البيانات على أكثر من 400000 زوج من أسئلة الصور والنصوص والإجابة عليها، تغطي 10 مجالات مثل الكيمياء والرياضيات والتغذية والموسيقى، و9 أنواع من الصور الغنية بالنص (المخططات والمستندات ومسائل الرياضيات والجداول والرسوم البيانية والرسومات المتجهة والنوتات الموسيقية ومخططات الدوائر والهياكل الكيميائية)، و2.7 مليون سطر من بيانات ضبط التعليمات (مثل نوع الصورة والموضوع ومعلومات إنشاء الكود)، مما يدعم مهام الإجابة على الأسئلة المرئية.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.