KodCode-V1 エンコーディング合成データセット
KodCode は、Microsoft GenAI、ワシントン大学、テキサス大学オースティン校の研究者によって 2025 年にリリースされました。KodCode: コーディングのための多様で挑戦的かつ検証可能な合成データセット”。
このデータセットは、コーディング タスクの検証可能なソリューションとテストを提供する、完全に合成された最大のオープン ソース データセットです。さまざまな分野 (アルゴリズムからパッケージ固有の知識まで) と難易度 (基本的なコーディング演習から面接や競技プログラミング チャレンジまで) をカバーする 12 の異なるサブセットが含まれており、教師あり微調整 (SFT) と RL 調整用に設計されています。

KodCode-V1.torrent
シーディング 1ダウンロード中 2ダウンロード完了 24総ダウンロード数 26