MHIST 조직병리학 이미지 데이터 세트

MHIST는 최소 조직병리학 이미지 분석 데이터 세트를 의미하며, 이진 분류 이미지 데이터 세트입니다. 이 데이터 세트에는 고정 크기의 대장직장 폴립 이미지 3,152개가 포함되어 있으며, 각 이미지의 골드 스탠다드 주석은 7명의 위장관 병리학자가 다수결 투표를 통해 결정합니다. MHIST에는 각 이미지에 대한 주석자 동의 수준도 포함됩니다. 최소 데이터 세트이므로 이 데이터 세트는 디스크 공간 400MB 미만을 차지합니다. ResNet-18 베이스라인은 3.5GB 메모리를 사용하여 NVIDIA RTX 3090에서 단 6분 만에 MHIST에서 수렴까지 학습합니다.
연구진은 MHIST를 활용 사례로 사용하여 조직병리학 이미지 분류에서 발생하는 자연스러운 문제, 예를 들어 데이터 세트 크기, 네트워크 깊이, 전이 학습, 높은 발산 예시가 모델 성능에 어떤 영향을 미치는지 연구했습니다.