[이미지 분할 데이터 세트 요약] Byte에서 COCONut을 출시하고 CVPR 2024에 선정되었습니다. 지금 바로 Segment Anything을 경험해 보세요!

컴퓨터 비전 기술의 지속적인 발전으로 이미지 분할은 많은 분야에서 중요한 응용 가치를 보여주었습니다. 최근 몇 년 동안 다양한 이미지 분할 데이터 세트가 비가 온 뒤 버섯처럼 솟아나왔습니다. 전달,ByteDance는 최초의 대규모 파노라마 이미지 분할 데이터 세트 "COCONut"을 출시했습니다.이를 통해 이 분야 연구에 새로운 활력이 불어넣어졌습니다.
이번 주에 HyperAI는 관련 연구의 진행 상황을 더욱 효과적으로 홍보하기 위해 10개의 고품질 이미지 분할 데이터 세트를 수집하고 분석했습니다.
또한, GitHub의 인기 프로젝트인 "Segment Anything"도 hyper.ai 공식 웹사이트의 "튜토리얼" 섹션에서 이용할 수 있습니다! 와서 이미지 분할의 세계를 경험해 보세요!
온라인 실행: https://go.hyper.ai/4GUjy
출판사:바이트댄스
출시 시간:2024
예상 크기:2.27GB
다운로드 주소:https://go.hyper.ai/D1XHs
COCONut은 ByteDance가 출시한 최초의 대규모 수동 주석 파노라마 이미지 분할 데이터 세트로, 약 383,000개의 이미지와 518만 개의 수동 주석이 달린 파노라마 분할 마스크가 포함되어 있습니다. 이 업적은 CVPR 2024에 선정되었습니다.
출판사:에인트호번 공과대학교
출시 시간:2021
예상 크기:157.78MB
다운로드 주소:https://go.hyper.ai/KD9NU
이 데이터 세트는 PASCAL VOC 2010 데이터 세트의 부분 인식 Panoptic Segmentation 작업에서 얻은 주석으로 구성되어 있습니다. 관련 결과는 CVPR 2021에 선정되었습니다.
3.PASCAL-5i 소규모 샘플 이미지 분할 데이터 세트
출판사:조지아 공과대학교
출시 시간:2020
예상 크기:112.42MB
다운로드 주소:https://go.hyper.ai/oNGRX
PASCAL-5i는 소수 샷 이미지 분할을 평가하기 위한 데이터 세트입니다. 데이터 세트는 4개 부분으로 나뉘며, 각 부분은 5개 카테고리를 포함하며 총 20개 카테고리가 있습니다.
출판사:매사추세츠 공과대학교
출시 시간:2010
예상 크기:8.15GB
다운로드 주소:https://go.hyper.ai/PWjWo
SUN09 데이터 세트는 200개 이상의 객체 카테고리를 포괄하는 12,000개의 주석이 달린 이미지로 구성되어 있습니다. 이 데이터 세트에는 자연, 실내, 실외 이미지가 포함되어 있습니다. 각 이미지에는 평균 7개의 서로 다른 주석이 달린 객체가 포함되어 있으며, 각 객체가 차지하는 평균 영역은 이미지 크기의 5 %입니다. 이 데이터 세트는 IEEE CVPR 2010에 출판되었습니다.
5.PASCAL VOC 2011 이미지 분할 데이터 세트
출판사:리즈 대학교
출시 시간:2011
예상 크기:1.7GB
다운로드 주소:https://go.hyper.ai/bXb4O
PASCAL VOC 2011은 이미지 분할 데이터 세트입니다. 훈련 세트에는 2,223개의 이미지와 5,034개의 대상 객체가 포함되어 있습니다. 테스트 세트에는 1,111개의 이미지와 2,028개의 대상 객체가 포함되어 있습니다. 총 5,000개 이상의 정확하게 분할된 객체가 훈련에 사용됩니다.
6.PhraseCut 언어 기반 이미지 분할 데이터 세트
출판사:매사추세츠 대학교 애머스트
출시 시간:2020
다운로드 주소:https://go.hyper.ai/bvzRm
PhraseCut 데이터 세트에는 77,262개의 이미지와 345,486개의 구문-영역 쌍이 포함되어 있습니다. 이 데이터 세트는 Visual Genome 데이터 세트에서 수집되었으며, 기존 주석을 사용하여 까다로운 참조 구문 세트를 생성하고 이러한 구문의 해당 영역에는 수동으로 주석이 달립니다.
출판사:막스 플랑크 지능 시스템 연구소
출시 시간:2019
다운로드 주소:https://go.hyper.ai/JfmOO
MPI는 Moldflow Plastic Insight의 약자로, 100만 개가 넘는 실제 3D 객체 이미지로 구성되어 있습니다. 이미지에는 색상, 모양, 크기, 객체의 위치 등 7가지 변수가 있습니다. 이 데이터 세트는 시뮬레이션 환경과 실제 환경 모두에서 표현 학습 알고리즘을 테스트하는 데 사용할 수 있습니다. 관련 결과는 NeurIPS 2019에 선정되었습니다.
출판사:비엔나 의과대학
출시 시간:2023
예상 크기:160MB
다운로드 주소:https://go.hyper.ai/Ybpbg
CryoNuSeg는 동결 절편 H&E 염색 조직 이미지에서 핵 인스턴스 분할을 위한 데이터 세트입니다. 이 데이터 세트에는 512×512픽셀의 고정 크기를 가진 10개의 인체 장기 이미지가 포함되어 있으며, 관찰자 내 및 관찰자 간 변동성을 측정할 수 있는 3개의 수동 주석이 제공됩니다.
출판사:대학 디지털 보존소
출시 시간:2020
예상 크기:18.3GB
다운로드 주소:https://go.hyper.ai/dxw78
TrashCan은 7,212개의 주석이 달린 이미지로 구성된 수중 쓰레기의 인스턴스 분할 데이터 세트로, 다양한 수중 쓰레기, 무인 잠수정, 해저 식물과 동물의 활동을 기록하고 있습니다. 이 데이터 세트의 주석은 인스턴스 분할 주석 형식을 채택하고, 이미지는 J-EDI 데이터 세트에서 가져왔습니다.
10.FSS-1000 소규모 샘플 이미지 분할 데이터 세트
출판사:홍콩과학기술대학교
출시 시간:2019
예상 크기:7.56GB
다운로드 주소:https://go.hyper.ai/eTDiv
FSS-1000은 1,000개의 클래스를 포함하는 몇 가지 샷 분할 데이터 세트입니다. 이 데이터 세트는 수동으로 주석이 달린 5개의 이미지만을 사용하여 이미지 인식을 완료하도록 모델을 훈련하는 작업을 살펴봅니다. 이 데이터 세트에는 일상용품, 상품, 만화 캐릭터, 로고 등 이전 데이터 세트에는 등장하거나 주석이 달린 적이 없는 많은 수의 객체가 포함되어 있습니다.
SegmentAnything 튜토리얼

SAM(Segment Anything Model)은 점이나 상자와 같은 입력 프롬프트를 기반으로 고품질 이미지 분할을 생성할 수 있는 머신 비전 모델이며, 이미지의 모든 객체에 대한 해당 마스크를 생성하는 데 사용할 수 있습니다. 1,100만 개의 이미지와 11억 개의 마스크로 구성된 데이터 세트를 기반으로 학습된 이 모델은 다양한 분할 작업에서 강력한 제로샷 성능을 달성하여 모든 것을 실제로 분할할 수 있습니다.
온라인 실행: https://go.hyper.ai/D1XHs
위에 나열된 것은 HyperAI가 수집한 10개의 이미지 분할 및 분류 데이터 세트입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기고 내용을 제출해 알려주세요!
HyperAI 소개
HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.
* 1200개 이상의 공개 데이터 세트에 대한 국내 가속 다운로드 노드 제공
* 300개 이상의 고전적이고 인기 있는 온라인 튜토리얼이 포함되어 있습니다.
* 100개 이상의 AI4Science 논문 사례 해석
* 500개 이상의 관련 용어 검색 지원
* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅
학습 여정을 시작하려면 공식 웹사이트를 방문하세요.