تصور مجموعة بيانات توليد الصور المرئية للأحداث متعددة المراحل
Envision هي مجموعة بيانات تضم أزواجًا من الصور والنصوص، وقد أصدرها مختبر شنغهاي للذكاء الاصطناعي في عام 2025. وعنوان البحث ذي الصلة هو "تصور: قياس الفهم الموحد وتوليد رؤى حول عمليات العالم السببيةالهدف هو اختبار قدرة النموذج على فهم السببية وتوليد أحداث متعددة المراحل في مواقف العالم الحقيقي.
تحتوي مجموعة البيانات على 1000 تسلسل أحداث و4000 نصٍّ مُكوَّن من أربع مراحل، تغطي ستة مجالات رئيسية: العلوم الطبيعية والعلوم الإنسانية/التاريخ. وقد جُمعت مواد الأحداث من الكتب الدراسية والموارد الإلكترونية، واختارها خبراء، ثم أنشأها وصقلها نموذج GPT-4o لتشكيل نصوص سردية ذات سلاسل سببية واضحة وبنية مراحل متدرجة.
تكوين البيانات:
- تغطية المواضيع (6 فئات إجمالاً)
- العلوم الطبيعية (75%): الفيزياء، الكيمياء، الأحياء، الأرصاد الجوية، الجغرافيا
- التاريخ والثقافة (25%)
- نوع البنية السببية
- السببية المستمرة: تغييرات مستمرة داخل نفس المشهد المكاني، قابلة للتطبيق على العمليات الفيزيائية والكيميائية الدقيقة.
- السببية المنفصلة: تقفز عبر مراحل الزمان والمكان، وهي قابلة للتطبيق على التطور الجيولوجي ودورة الحياة والأحداث التاريخية.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.