HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات توليد الكود متعدد الوسائط MCD

التاريخ

منذ 2 أشهر

الحجم

18 GB

المؤسسة

أبحاث مايكروسوفت
جامعة بكين
جامعة الجنوب للعلوم والتكنولوجيا

رابط الورقة البحثية

2508.09945

مجموعة بيانات الترميز متعدد الوسائط (MCD) هي مجموعة بيانات واسعة النطاق اقترحتها شركة مايكروسوفت للأبحاث وجامعة بكين وجامعة العلوم والتكنولوجيا الجنوبية وتم إصدارها في عام 2025. نتائج الورقة ذات الصلة هي "VisCodex: توليد كود متعدد الوسائط موحد عبر دمج نماذج الرؤية والترميز".

تحتوي مجموعة البيانات على ما مجموعه حوالي 598000 عينة/زوج عالي الجودة، منظمة بتنسيق يتبع التعليمات، وتغطي وسائط إدخال متعددة (نص، صور، كود) ووسائط إخراج (كود، إجابات، تفسيرات)، وهي مناسبة لمهام فهم الكود متعدد الوسائط وتوليده.

تتضمن البيانات ما يلي:

  • كود HTML المعزز (HTML): حوالي 200000 زوج من الكود-لقطة الشاشة، مع التركيز على التأثيرات المرئية والتحسين الهيكلي.
  • المخطط: حوالي 210,000 زوجًا من الصور والرموز لإعادة إنتاج الصورة إلى الرمز.
  • الأسئلة والأجوبة (QA): حوالي 59000 زوجًا من الكود والسؤال والإجابة، حيث تتركز الأسئلة والأجوبة حول الكود.
  • الخوارزمية: حوالي 129000 مشكلة في ترميز الخوارزمية وعينات تتبع التعليمات.

MCD.torrent
البذر 1التنزيل 0مكتمل 8إجمالي التنزيلات 38
  • MCD/
    • README.md
      1.75 KB
    • README.txt
      3.5 KB
      • data/
        • MCD.zip
          18 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp