날짜

4년 전

조직

게시 URL

github.com

Paper URL

arxiv.org

라이선스

Other

태그

이미지 설명

CC12M(Conceptual 12M)은 시각 및 언어 사전 훈련을 위해 특별히 설계된 이미지-텍스트 쌍의 데이터 세트입니다. 이 데이터 세트에는 1,200만 개의 이미지-텍스트 쌍이 포함되어 있습니다. CC3M과 비교했을 때, 이 데이터 세트는 여러 다운스트림 작업에 대한 롱테일 시각적 인식에서 더 나은 성능을 보입니다.

소환

@inproceedings{changpinyo2021cc12m, 제목 = {{개념 12M}: 웹 규모 이미지-텍스트 사전 학습을 통해 롱테일 시각적 개념 인식을 향상시키다}, 저자 = {Changpinyo, Soravit 및 Sharma, Piyush 및 Ding, Nan 및 Soricut, Radu}, 책 제목 = {CVPR}, 연도 = {2021}, }

이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.

undefined

Command Palette

CC12M 이미지-텍스트 쌍 데이터 세트

소환

AI로 AI 구축

HyperAI Newsletters

Command Palette

CC12M 이미지-텍스트 쌍 데이터 세트

소환

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

Nemotron-SFT-Math-v4 수학적 추론 SFT 데이터셋

FigureBench 과학 일러스트레이션 생성 벤치마크 데이터 세트

TACK 타겟 키메라 지식 기반 데이터 세트

EAVSD 전자상거래 광고 비디오 스토리보드 데이터셋

DeepCrack 인프라 크랙 탐지 데이터셋

세계 대기 오염 및 대기질 지수 데이터 세트

SMOL 다국어 번역 병렬 데이터 세트

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

MemLens 멀티모달 장기 컨텍스트 벤치마크 데이터셋

VisCoR-55K 시각적 추론 데이터셋

AgentTrove 지능형 에이전트 상호작용 궤적 데이터 세트

MathNet 멀티모달 수학 벤치마크 추론 데이터셋

장거리 산불 및 연기 감지 데이터 세트

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

감정 탐지 데이터셋

BRIGHT 재난 건물 평가 데이터 세트

MDPBench 다국어 문서 구문 분석 벤치마크 데이터셋

AI로 AI 구축

HyperAI Newsletters

Command Palette

CC12M 이미지-텍스트 쌍 데이터 세트

소환

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

Nemotron-SFT-Math-v4 수학적 추론 SFT 데이터셋

FigureBench 과학 일러스트레이션 생성 벤치마크 데이터 세트

TACK 타겟 키메라 지식 기반 데이터 세트

EAVSD 전자상거래 광고 비디오 스토리보드 데이터셋

DeepCrack 인프라 크랙 탐지 데이터셋

세계 대기 오염 및 대기질 지수 데이터 세트

SMOL 다국어 번역 병렬 데이터 세트

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

MemLens 멀티모달 장기 컨텍스트 벤치마크 데이터셋

VisCoR-55K 시각적 추론 데이터셋

AgentTrove 지능형 에이전트 상호작용 궤적 데이터 세트

MathNet 멀티모달 수학 벤치마크 추론 데이터셋

장거리 산불 및 연기 감지 데이터 세트

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

감정 탐지 데이터셋

BRIGHT 재난 건물 평가 데이터 세트

MDPBench 다국어 문서 구문 분석 벤치마크 데이터셋

AI로 AI 구축

HyperAI Newsletters

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

Nemotron-SFT-Math-v4 수학적 추론 SFT 데이터셋

FigureBench 과학 일러스트레이션 생성 벤치마크 데이터 세트

TACK 타겟 키메라 지식 기반 데이터 세트

EAVSD 전자상거래 광고 비디오 스토리보드 데이터셋

DeepCrack 인프라 크랙 탐지 데이터셋

세계 대기 오염 및 대기질 지수 데이터 세트

SMOL 다국어 번역 병렬 데이터 세트

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

MemLens 멀티모달 장기 컨텍스트 벤치마크 데이터셋

VisCoR-55K 시각적 추론 데이터셋

AgentTrove 지능형 에이전트 상호작용 궤적 데이터 세트

MathNet 멀티모달 수학 벤치마크 추론 데이터셋

장거리 산불 및 연기 감지 데이터 세트

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

감정 탐지 데이터셋

BRIGHT 재난 건물 평가 데이터 세트

MDPBench 다국어 문서 구문 분석 벤치마크 데이터셋

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트