Command Palette

Search for a command to run...

MMMC 교육용 비디오 생성 벤치마크 데이터 세트

날짜

19일 전

기관

싱가포르 국립대학교

논문 URL

2510.01174

라이선스

MIT

Discord 커뮤니티 참여

MMMC는 싱가포르 국립대학교 쇼랩에서 2025년에 발표한 교육용 비디오 생성을 위한 대규모 다학제 교육용 비디오 생성 벤치마크 데이터셋입니다. 관련 논문 결과는 다음과 같습니다.Code2Video: 교육용 비디오 생성을 위한 코드 중심 패러다임"는 교육용 인공지능 모델을 위한 고품질의 훈련 및 평가 리소스를 제공하고, 구조화된 코드와 교육 콘텐츠로부터 전문적인 교육 비디오를 자동으로 생성하는 연구를 지원하는 것을 목표로 합니다.

이 데이터세트는 미적분학, 기하, 확률론, 신경망을 포함한 13개 과목을 다루는 117개의 완전한 교육용 비디오를 포함합니다. 전체 비디오의 평균 길이는 1,014초(약 16.9분)이며, 분할된 비디오의 평균 길이는 201초(약 3.35분)입니다. 이 데이터는 효과적인 교육과 정교한 애니메이션 제작으로 유명한 3Blue1Brown(3B1B) YouTube 교육용 비디오 라이브러리에서 제공되었습니다. MMMC는 두 가지 기준을 기반으로 구축되었습니다. 교육적 관련성(각 주제가 교육학적 가치를 지님을 의미)과 실행 가능한 지원(각 개념이 시각화 및 재현성을 보장하기 위해 고품질 Manim 참고 자료와 일치함을 의미)입니다.

데이터 세트 구조

  • 데이터 파일
    • metadata.jsonl: 각 비디오 인스턴스에 대한 구조화된 정보를 담고 있는 주요 메타데이터 파일입니다.
  • metadata.jsonl의 각 항목에는 다음이 포함됩니다.
    • id: 비디오 슬라이스의 고유 식별자입니다.
    • 카테고리: 고급 과목 카테고리(예: 수학, 물리학, 컴퓨터 과학).
    • 비디오: 해당 교육용 비디오 클립의 파일 경로입니다.
    • main_topics: 교육 주제 목록.
    • num_slices: 강의가 나누어진 비디오 슬라이스 수입니다.
    • reference_image: 주제와 관련된 주요 참조 이미지(선택 사항).

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
MMMC 교육용 비디오 생성 벤치마크 데이터 세트 | 데이터셋 | HyperAI초신경