Command Palette
Search for a command to run...
MMMC教育ビデオ生成ベンチマークデータセット
MMMCは、シンガポール国立大学のショーラボが2025年にリリースした、教育ビデオ生成のための大規模な学際的な教育ビデオ生成ベンチマークデータセットです。関連する論文の結果は次のとおりです。Code2Video: 教育ビデオ生成のためのコード中心のパラダイム」は、教育用人工知能モデル向けの高品質なトレーニングおよび評価リソースを提供し、構造化されたコードと教育コンテンツから専門的な教育ビデオを自動的に生成する研究を支援することを目的としています。
このデータセットには、微積分、幾何学、確率論、ニューラルネットワークなど13の分野を網羅した117本の完全な教育ビデオが含まれています。フルビデオの平均再生時間は1,014秒(約16.9分)、セグメントビデオの平均再生時間は201秒(約3.35分)です。データは、効果的な教育と精巧なアニメーション制作で知られる3Blue1Brown(3B1B)のYouTube教育ビデオライブラリから取得されています。MMMCは、2つの基準に基づいて構築されました。1つは教育的関連性、つまり各トピックが教育的価値を持っていること、もう1つは実用的なサポート、つまり各概念が高品質なManimリファレンスに対応付けられていることです。これにより、視覚化と再現性が確保されます。
データセットの構造
- データファイル
- metadata.jsonl: 各ビデオインスタンスの構造化された情報を含むメインのメタデータ ファイル。
 
 
- metadata.jsonl の各エントリには次の内容が含まれます。
- id: ビデオ スライスの一意の識別子。
 - カテゴリ: 高度な科目カテゴリ (例: 数学、物理学、コンピューターサイエンス)。
 - ビデオ: 対応する教育用ビデオ クリップのファイル パス。
 - main_topics: 教育トピックのリスト。
 - num_slices: 講義が分割されるビデオスライスの数。
 - reference_image: 主題に関連する主要な参照画像 (オプション)。