HyperAI초신경

Cops-Ref 객체 참조 이해 데이터 세트

날짜

2년 전

기관

홍콩대학교

발행 주소

github.com

라이선스

其他

카테고리

다운로드 도움말
特色图像

Cops-Ref는 Compositional Refering Expression Comprehension의 약자로, 대상 객체 참조 이해에 대한 시각적 추론 이미지 데이터 세트입니다. 이 데이터 세트에는 75,299개의 실제 이미지, 148,712개의 텍스트 설명, 1,307,885개의 후보 지역이 포함되어 있습니다.

이 데이터 세트에는 두 가지 주요 특징이 있습니다. 하나는 추론 논리와 시각적 특징을 결합하여 다양한 수준의 복잡성을 지닌 텍스트 설명을 생성할 수 있는 새로운 텍스트 생성 엔진입니다. 다른 하나는 시험 중에 의미적으로 유사한 시각적 이미지를 방해하는 새로운 시험 설정입니다.