Command Palette
Search for a command to run...
MCD マルチモーダルコード生成データセット
マルチモーダルコーディングデータセット(MCD)は、マイクロソフトリサーチ、北京大学、南方科技大学によって提案され、2025年に公開された大規模データセットです。関連する論文の結果は次のとおりです。VisCodex: ビジョンとコーディングモデルの統合による統合マルチモーダルコード生成”。
データセットには、合計約 598,000 個の高品質サンプル/ペアが含まれており、複数の入力形式 (テキスト、画像、コード) と出力形式 (コード、回答、説明) をカバーし、マルチモーダル コードの理解および生成タスクに適しています。
データには以下が含まれます:
- 強化された HTML コード (HTML): 視覚効果と構造の最適化に重点を置いた、約 200,000 個のコードとスクリーンショットのペア。
- 図: 画像とコードを再現するための約 210,000 個の画像とコードのペア。
- 質問と回答 (QA): コード、質問、回答のペアが約 59,000 件あり、質問と回答はコードを中心にしています。
- アルゴリズム: 約 129,000 個のアルゴリズム コーディング問題と命令に従うサンプル。
MCD.torrent
シーディング 1ダウンロード中 0ダウンロード完了 8総ダウンロード数 39