Command Palette
Search for a command to run...
مجموعة بيانات معيارية لتوليد الصور متعددة الوسائط T2I-CoReBench
التاريخ
رابط الورقة البحثية
الترخيص
Apache 2.0
T2I-CoReBench هو معيار تقييم شامل لنماذج توليد الصور المعتمدة على النصوص، والذي اقترحته جامعة العلوم والتكنولوجيا في الصين، وفريق Kuaishou Technology Kling، وجامعة هونج كونج في عام 2025. نتائج الورقة البحثية ذات الصلة هي "الرسم أسهل من التفكير: هل تستطيع نماذج النص إلى صورة أن تحدد المسرح، لكنها لا تستطيع توجيه المسرحية؟"، والذي يهدف إلى قياس قدرة الجمع والقدرة على التفكير لنماذج توليد الصور في وقت واحد.
تحتوي مجموعة البيانات على 1080 مطالبة شديدة التحدي ومجهزة بما يقرب من 13500 عنصر تفتيش تغطي 12 بُعدًا، والتي تُستخدم لتقييم ما إذا كان كل عنصر متوقع في الصورة المولدة يتم تقديمه بشكل صحيح.
تكوين البيانات
تصمم مجموعة البيانات هذه أنظمة التقييم والمطالبات من بعدين:
- أبعاد التكوين: قم ببناء هياكل تكوين مختلفة حول ثلاثة أنواع من عناصر الرسم البياني للمشهد: المثيل، والسمة، والعلاقة.
- البعد الاستدلالي: يعتمد على ثلاثة أنواع من الاستدلال: الاستنتاجي، والاستقرائي، والاستنباطي.
لتسهيل التقييم الدقيق، يتم إرفاق كل مطالبة بقائمة تحقق بنعم/لا تشير إلى ما إذا كان كل عنصر مطلوب ضمناً أو صراحةً بواسطة المطالبة قد تم تقديمه بشكل صحيح.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.