HyperAI초신경

조류 525종 525종의 조류 이미지 데이터 세트

날짜

일 년 전

크기

1.96 GB

기관

캐글

발행 주소

www.kaggle.com

特色图像

데이터 세트 개요

이 데이터 세트에는 525종의 조류, 84,635개의 훈련 이미지, 2,625개의 테스트 이미지, 2,625개의 검증 이미지가 포함되어 있습니다.

데이터 정리 및 품질 보증

  • 중복 제거 및 노이즈 제거: 분석 도구를 사용하여 데이터 세트를 정리하고 중복되거나 거의 중복된 이미지, 결함이 있거나 정보가 부족한 이미지를 제거합니다.
  • 데이터 세트 분리: 훈련, 테스트, 검증 데이터 세트 사이에 정보 유출이 없는지 확인합니다.

데이터 세트 특성

  • 이미지 품질: 이미지는 원본이며 보정되지 않았으며, 각 이미지에는 새가 한 마리만 있고, 일반적으로 최소 50% 픽셀을 차지합니다.
  • 기대 성능: 중간 복잡도의 모델은 약 90%의 학습 및 테스트 정확도를 달성할 것으로 예상됩니다.

기술 사양

  • 이미지 크기: 모든 이미지는 224 X 224 X 3색 JPG 형식입니다.
  • 데이터 세트 구조: 훈련 세트, 테스트 세트, 검증 세트를 포함하고, 각 세트에는 525개의 하위 디렉토리가 있으며, 각 하위 디렉토리는 조류 종에 해당합니다.

데이터 세트 사용을 위한 권장 사항

  • 데이터 생성기: Keras ImageDataGenerator.flow_from_directory를 사용하여 데이터 생성기를 만드는 것이 좋습니다.
  • 지원 파일: 데이터 세트에는 다음이 포함됩니다. bird.csv 이미지 경로, 레이블, 학명, 데이터 세트 유형 및 클래스 인덱스 값이 포함된 파일입니다.

데이터 수집 및 처리

  • 이미지 출처: 인터넷 검색을 통해 수집하고, 다운로드 후 중복되거나 거의 중복된 이미지를 검사하여 삭제했습니다.
  • 이미지 처리: 이미지를 자르고 크기를 조정하여 새 이미지가 최소 50% 픽셀을 차지하도록 합니다.

데이터 세트 제한 사항

  • 이미지 크기 권장 사항: 학습 시간을 줄이기 위해 150 X 150 X 3 크기의 이미지 사용을 권장합니다.
  • 문서 번호: 모든 파일은 종별로 번호가 매겨져 있으며, 훈련 이미지에는 순서를 유지하기 위해 0이 채워져 있습니다.
  • 불균형 데이터 세트: 훈련 세트에 있는 각 종의 이미지 수는 다르지만, 적어도 130개의 이미지가 있습니다.
  • 성 편견: 이미지 중 약 80%가 남성이고 20%가 여성인데, 이로 인해 분류기가 여성 이미지에 대한 성능이 저하될 수 있습니다.
BIRDS-525-SPECIES.torrent
시딩 1다운로드 중 2완료됨 151총 다운로드 횟수 328
  • BIRDS-525-SPECIES/
    • README.md
      2.45 KB
    • README.txt
      4.89 KB
      • data/
        • birds.zip
          1.96 GB