HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Génération De Codes Multimodaux MCD

L'ensemble de données de codage multimodal (MCD) est un ensemble de données à grande échelle proposé par Microsoft Research, l'Université de Pékin et l'Université des sciences et technologies du Sud et publié en 2025. Les résultats de l'article associé sont «VisCodex : Génération de code multimodal unifié via la fusion de modèles de vision et de codage".

L'ensemble de données contient un total d'environ 598 000 échantillons/paires de haute qualité, organisés dans un format de suivi d'instructions, couvrant plusieurs modalités d'entrée (texte, images, code) et modalités de sortie (code, réponses, explications), et convient aux tâches de compréhension et de génération de code multimodal.

Les données comprennent :

  • Code HTML amélioré (HTML) : environ 200 000 paires code-capture d'écran, axées sur les effets visuels et l'optimisation structurelle.
  • Graphique : Environ 210 000 paires image-code pour la reproduction image-code.
  • Questions et réponses (QA) : environ 59 000 paires code-question-réponse, avec des questions et des réponses centrées sur le code.
  • Algorithme : environ 129 000 problèmes de codage d'algorithmes et échantillons de suivi d'instructions.

MCD.torrent
Partage 1Téléchargement 0Terminés 8Téléchargements totaux 38
  • MCD/
    • README.md
      1.75 KB
    • README.txt
      3.5 KB
      • data/
        • MCD.zip
          18 GB

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp