CoPhIR 데이터셋은 Flickr에서 수집한 약 1억 600만 개의 이미지로 구성된 데이터셋으로, 주로 이미지 분류에 사용됩니다. 이미지는 위치, 제목, 태그, 주석 등 차트 자체의 데이터를 포함할 뿐만 아니라 색상 패턴, 색상 레이아웃, 에지 히스토그램, 균일한 질감 등을 추출할 수도 있습니다.
이 데이터 세트는 2009년 NMIS 연구실에서 공개되었습니다. 관련 논문으로는 "CoPhIR: 콘텐츠 기반 이미지 검색을 위한 테스트 컬렉션"과 "대규모 디지털 도서관에서 콘텐츠 기반 이미지 검색 활성화"가 있습니다.