Command Palette
Search for a command to run...
CoSyn-400K 다중 모드 합성 질의응답 데이터세트
CoSyn-400K는 펜실베이니아 대학과 앨런 인공지능 연구소가 2025년에 공동으로 공개한 다중 모드 합성 질의응답 데이터 세트입니다.코드 기반 합성 멀티모달 데이터 생성을 통한 텍스트가 풍부한 이미지 이해 확장"는 다중 모드 모델 학습을 위한 고품질의 확장 가능한 합성 데이터 리소스를 제공하는 것을 목표로 합니다.
이 데이터 세트에는 화학, 수학, 영양학, 음악 등 10개 분야를 포괄하는 40만 개 이상의 이미지-텍스트 질의-답변 쌍과 9가지 유형의 텍스트가 풍부한 이미지(차트, 문서, 수학 문제, 표, 차트, 벡터 그래픽, 악보, 회로도, 화학 구조) 및 270만 줄의 명령어 튜닝 데이터(이미지 유형, 테마, 코드 생성 정보 등)가 포함되어 시각적 질의-답변 작업을 지원합니다.
CoSyn-400K.torrent
시딩 1다운로드 중 0완료됨 16총 다운로드 횟수 73