Command Palette

Search for a command to run...

CoSyn-400K 다중 모드 합성 질의응답 데이터세트

날짜

3달 전

크기

59.4 GB

기관

앨런 인공지능 연구소
펜실베이니아 대학교

논문 URL

arxiv.org

CoSyn-400K는 펜실베이니아 대학과 앨런 인공지능 연구소가 2025년에 공동으로 공개한 다중 모드 합성 질의응답 데이터 세트입니다.코드 기반 합성 멀티모달 데이터 생성을 통한 텍스트가 풍부한 이미지 이해 확장"는 다중 모드 모델 학습을 위한 고품질의 확장 가능한 합성 데이터 리소스를 제공하는 것을 목표로 합니다.

이 데이터 세트에는 화학, 수학, 영양학, 음악 등 10개 분야를 포괄하는 40만 개 이상의 이미지-텍스트 질의-답변 쌍과 9가지 유형의 텍스트가 풍부한 이미지(차트, 문서, 수학 문제, 표, 차트, 벡터 그래픽, 악보, 회로도, 화학 구조) 및 270만 줄의 명령어 튜닝 데이터(이미지 유형, 테마, 코드 생성 정보 등)가 포함되어 시각적 질의-답변 작업을 지원합니다.

CoSyn-400K.torrent
시딩 1다운로드 중 0완료됨 16총 다운로드 횟수 73
  • CoSyn-400K/
    • README.md
      1.56 KB
    • README.txt
      3.11 KB
      • data/
        • CoSyn-400K.zip
          59.4 GB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
CoSyn-400K 다중 모드 합성 질의응답 데이터세트 | 데이터셋 | HyperAI초신경