2달 전

덴마크 곰팡이 2020 -- 단순한 이미지 인식 데이터셋이 아님

Picek, Lukáš ; Šulc, Milan ; Matas, Jiří ; Heilmann-Clausen, Jacob ; Jeppesen, Thomas S. ; Læssøe, Thomas ; Frøslev, Tobias
덴마크 곰팡이 2020 -- 단순한 이미지 인식 데이터셋이 아님
초록

우리는 새로운 세부적인 데이터셋 및 벤치마크인 덴마크 곰팡이 2020 (DF20)을 소개합니다. 이 데이터셋은 덴마크 곰팡이 아틀라스에 제출된 관찰 자료를 기반으로 구성되었으며, 정확한 분류학적 클래스 레이블, 적은 수의 오류, 극단적으로 불균형한 긴 꼬리 클래스 분포, 풍부한 관찰 메타데이터, 그리고 명확하게 정의된 클래스 계층 구조로 독특합니다. DF20은 ImageNet과 중복되는 부분이 전혀 없어, 공개된 ImageNet 체크포인트에서 미세 조정(fine-tuned)된 모델 간의 편향되지 않은 비교가 가능합니다. 제안된 평가 프로토콜은 메타데이터(예: 정확한 지리적 위치, 서식지, 기질)를 활용하여 분류 성능을 개선하는 능력을 테스트할 수 있으며, 분류기 교정(calibration) 테스트를 용이하게 하고, 마지막으로 장비 설정이 분류 성능에 미치는 영향을 연구할 수 있게 합니다. 합성곱 신경망(Convolutional Neural Networks, CNN)과 최근의 비전 트랜스포머(Vision Transformers, ViT)를 사용한 실험 결과는 DF20이 도전적인 작업임을 보여줍니다. 흥미롭게도, ViT는 80.45%의 정확도와 0.743의 매크로 F1 점수를 달성하여 CNN 베이스라인보다 각각 9%와 12%의 오류 감소를 보였습니다. 결정 과정에 메타데이터를 포함시키는 간단한 절차는 분류 정확도를 2.95 백분점 이상 개선하며, 오류율을 15% 감소시킵니다. 모든 방법 및 실험에 대한 소스 코드는 https://sites.google.com/view/danish-fungi-dataset에서 제공됩니다.

덴마크 곰팡이 2020 -- 단순한 이미지 인식 데이터셋이 아님 | 최신 연구 논문 | HyperAI초신경