HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات توليد الكود متعدد الوسائط MCD

Date

منذ 4 أشهر

Size

18 GB

Organization

أبحاث مايكروسوفت
جامعة بكين
جامعة الجنوب للعلوم والتكنولوجيا

Paper URL

2508.09945

مجموعة بيانات الترميز متعدد الوسائط (MCD) هي مجموعة بيانات واسعة النطاق اقترحتها شركة مايكروسوفت للأبحاث وجامعة بكين وجامعة العلوم والتكنولوجيا الجنوبية وتم إصدارها في عام 2025. نتائج الورقة ذات الصلة هي "VisCodex: توليد كود متعدد الوسائط موحد عبر دمج نماذج الرؤية والترميز".

تحتوي مجموعة البيانات على ما مجموعه حوالي 598000 عينة/زوج عالي الجودة، منظمة بتنسيق يتبع التعليمات، وتغطي وسائط إدخال متعددة (نص، صور، كود) ووسائط إخراج (كود، إجابات، تفسيرات)، وهي مناسبة لمهام فهم الكود متعدد الوسائط وتوليده.

تتضمن البيانات ما يلي:

  • كود HTML المعزز (HTML): حوالي 200000 زوج من الكود-لقطة الشاشة، مع التركيز على التأثيرات المرئية والتحسين الهيكلي.
  • المخطط: حوالي 210,000 زوجًا من الصور والرموز لإعادة إنتاج الصورة إلى الرمز.
  • الأسئلة والأجوبة (QA): حوالي 59000 زوجًا من الكود والسؤال والإجابة، حيث تتركز الأسئلة والأجوبة حول الكود.
  • الخوارزمية: حوالي 129000 مشكلة في ترميز الخوارزمية وعينات تتبع التعليمات.

MCD.torrent
Seeding 1Downloading 0Completed 15Total Downloads 78
  • MCD/
    • README.md
      1.75 KB
    • README.txt
      3.5 KB
      • data/
        • MCD.zip
          18 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp